Seznámení s hlavními obory počítačové lingvistiky a s problémy, které tyto obory řeší. Důraz je kladen na zejména na strojový překlad, syntaktickou analýzu, morfologii a korpusovou lingvistiku.
Poslední úprava: T_UFAL (10.05.2001)
The main goal of this course is to provide an overview of individual subfields of computational linguistics. Main issues being solved by these subfields are also mentioned. Among the subfields the course stresses are machine translation, syntactic parsing, morphology and corpus linguistics.
Literatura -
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (15.05.2023)
R. Grishman. Computational Linguistics: An Introduction. ACL Studies in Nantural Language Processing. Cambridge University Press, 1986.
P. Sgall. E. Hajičová and J. Panevová. Učíme stroje česky. Academia. P. Sgall a kolektiv. Úvod do syntaxe a sémantiky. Academia. 1986.
W. Clocksin and C. Mellish. Programming in Prolog. Springer-Verlag, Berlin, 2nd edition, 1984 (existuje také v českém překladu)
G. Gazdar and C. Mellish. Natural Language processing in Prolog. Addison Wesley, Wokingham, England, 1989.
M. Covington. NLP for Prolog Programmers. Prentice Hall. 1993.
B. Grosz, K. Sparck-Jones and B.L. Webber (eds.). Readings in Natural Language Processing. Morgan Kaufmann, los Altos, CA, 1986.
R. Hauser. Introduction to NLP. Springer-Verlag, 1987
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (15.05.2023)
R. Grishman. Computational Linguistics: An Introduction. ACL Studies in Nantural Language Processing. Cambridge University Press, 1986.
B. Grosz, K. Sparck-Jones and B.L. Webber (eds.). Readings in Natural Language Processing. Morgan Kaufmann, los Altos, CA, 1986.
R. Hauser. Introduction to NLP. Springer-Verlag, 1987
KIRSCHNER. Z. (1983). MOSAIC - A Method of Automatic Extraction of Significant Terms from Texts. Praha : MFF UK, 1983. 124 s.
Králíková, K., Panevová, J. (1990). "ASIMUT - A Method for Automatic Information Retrieval from Full Texts", Explizite Beschreibung der Sprache und automatische Textbearbeitung XVII, Faculty of Mathematics and Physics, Charles University, Prague.
Jan Hajič, Alena Böhmová, Eva Hajičová, Barbora Vidová Hladká: "The Prague Dependency Treebank: A Three-Level Annotation Scenario". In: A. Abeillé (ed.): Treebanks: Building and Using Parsed Corpora, Amsterdam:Kluwer, 2000, pp. 103-127
Sylabus -
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (15.05.2023)
1. Úvod, přehled podoborů počítačové lingvistiky a jejich obsah
2. Přirozený jazyk, jeho funkce a struktura
3. Zpracování jazyka na úrovni znaků, metody korekce překlepů
4. ASIMUT = metoda automatického skloňování českých slov
5. Syntaxe jazyka, přehled hlavních způsobů jejího formálního zachycení
6. Statistické metody v syntaxi a morfologii
7. Automatický překlad.
8. Jevy v přirozeném jazyce za hranicemi syntaxe, problematika zachycení těchto jevů, roviny popisu, logický zápis významu a smyslu vět, pravdivostní podmínky, užití jazyka v komunikaci, komunikační záměr a promluvový akt.
9. Od věty k souvislému projevu v přirozeném jazyce (mluvený a psaný diskurz, dialog), koreferenční mezivětné vztahy, užití zájmen a jiných prostředků zkráceného vyjádření.
10. Praktické problémy s automatizovaným zpracováním mezivětných koreferenčních vztahů na příkladech automatického překladu, dobývání informací z textu a uživatelského rozhraní v přirozeném jazyce.
11. Od věty k jejímu obsahu a zase zpět, reprezentace znalostí, odkazování, inference jako součást interpretace přirozeného jazyka.
12. Využití reprezentace znalostí v systémech pro automatizované vyhledávání v textech, dobývání informací z textů a automatizovanou tvorbu textů.
13. Přehled existujících systémů pro automatizované zpracování přirozeného jazyka podle hlavních metod, dosažené výsledky.
14. Formální prostředky vyvinuté pro popis souvislého projevu v přirozeném jazyce, reprezentace kontextu a jeho dynamického obohacování.
Poslední úprava: doc. RNDr. Vladislav Kuboň, Ph.D. (15.05.2023)