PředmětyPředměty(verze: 811)
Předmět, akademický rok 2017/2018
   Přihlásit přes CAS
Aplikace NLP - NPFL093
Anglický název: NLP Applications
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2012
Semestr: letní
E-Kredity: 5
Rozsah, examinace: letní s.:2/1 KZ [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Garant: doc. RNDr. Vladislav Kuboň, Ph.D.
Třída: Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Anotace -
Poslední úprava: T_UFAL (10.05.2010)

Cílem předmětu je seznámit studenty se základními typy aplikací počítačové lingvistiky a dát jim příležitost si některé z nich vyzkoušet na cvičeních. Jedná se zejména o systémy automatického překladu a automatizované nástroje na podporu lidského překladu, o lokalizační nástroje, o vyhledávání a extrakci informací, zodpovídání dotazů, rozpoznávání mluvené řeči, kontrolu překlepů, kontrolu gramatické správnosti, generování textů v přirozeném jazyce apod.
Literatura -
Poslední úprava: T_UFAL (10.05.2010)

Handbook of NLP, ed. N.Indurkhya, F.Damerau, CRC Press, 2010.

Foundations of Statistical Natural Language Processing, C. Manning and H. Schütze, MIT Press, 1999.

Sylabus -
Poslední úprava: T_UFAL (10.05.2010)

1. Úvod - přehled základních komponent aplikací.

2. Kontrola překlepů

Slovníkové metody vs. kontrola neexistujících skupin znaků, metriky pro zjišťování podobnosti řetězců, komunikace s uživatelem.

3. Kontrola gramatické správnosti

Chybové vzorky vs. syntaktická analýza, typy zachytitelných chyb, postoj k uživateli, RFODG a LanGR.

4. Nástroje na podporu lidského překladu

Překladová paměť a varianty jejího použití v komerčních produktech, řízené psaní, hierarchie glosářů.

5. Automatický překlad

Google Translate vs. pravidlové komerční systémy (Systran, PC Translator), metody měření kvality překladu, vyhodnocování překladových soutěží, projekt Euromatrix.

6. Lokalizace

Rozdíly mezi překladem a lokalizací, komerční lokalizační nástroje.

7. Generování

Generování textů z tektogramatické roviny.

8. Vyhledávání a extrakce informací

Základní modely, evaluační metriky, metriky podobnosti textů, lemmatizace, stop slova, role jazykových nástrojů, projekt Malach.

9. Zodpovídání dotazů

Dialogové systémy, multimodální komunikace.

10. Rozpoznávání a syntéza mluvené řeči

Základní problémy, používané algoritmy.

11. Sémantický web

Využití lingvistických metod pro získávání informací z webu, role tektogramatické roviny.

 
Univerzita Karlova | Informační systém UK