|
|
|
||
Cílem předmětu je seznámit studenty se základními typy aplikací počítačové lingvistiky a dát jim
příležitost si některé z nich vyzkoušet na cvičeních. Jedná se zejména o systémy automatického
překladu a automatizované nástroje na podporu lidského překladu, o lokalizační nástroje, o
vyhledávání a extrakci informací, zodpovídání dotazů, rozpoznávání mluvené řeči, kontrolu
překlepů, kontrolu gramatické správnosti, generování textů v přirozeném jazyce apod.
Poslední úprava: T_UFAL (10.05.2010)
|
|
||
The course requires a continuous work of students in the form of reports describing topics of individual lectures. The reports are required even if a student is not present on the lecture, in such a case (s)he submits a general report on the topic of the missed lecture. A participation is strongly recommended. After submitting all reports, the student obtains a grade based upon the quality of those reports. Poslední úprava: Kuboň Vladislav, doc. RNDr., Ph.D. (22.04.2020)
|
|
||
Handbook of NLP, ed. N.Indurkhya, F.Damerau, CRC Press, 2010. Foundations of Statistical Natural Language Processing, C. Manning and H. Schütze, MIT Press, 1999. Poslední úprava: T_UFAL (10.05.2010)
|
|
||
1. Úvod - přehled základních komponent aplikací. 2. Kontrola překlepů Slovníkové metody vs. kontrola neexistujících skupin znaků, metriky pro zjišťování podobnosti řetězců, komunikace s uživatelem. 3. Kontrola gramatické správnosti Chybové vzorky vs. syntaktická analýza, typy zachytitelných chyb, postoj k uživateli, RFODG a LanGR. 4. Nástroje na podporu lidského překladu Překladová paměť a varianty jejího použití v komerčních produktech, řízené psaní, hierarchie glosářů. 5. Automatický překlad Google Translate vs. pravidlové komerční systémy (Systran, PC Translator), metody měření kvality překladu, vyhodnocování překladových soutěží, projekt Euromatrix. 6. Lokalizace Rozdíly mezi překladem a lokalizací, komerční lokalizační nástroje. 7. Generování Generování textů z tektogramatické roviny. 8. Vyhledávání a extrakce informací Základní modely, evaluační metriky, metriky podobnosti textů, lemmatizace, stop slova, role jazykových nástrojů, projekt Malach. 9. Zodpovídání dotazů Dialogové systémy, multimodální komunikace. 10. Rozpoznávání a syntéza mluvené řeči Základní problémy, používané algoritmy. 11. Sémantický web Využití lingvistických metod pro získávání informací z webu, role tektogramatické roviny. Poslední úprava: T_UFAL (10.05.2010)
|