The main goal of this course is to provide an overview of individual subfields of computational linguistics. Main issues being solved by these subfields are also mentioned. Among the subfields the course stresses are machine translation, syntactic parsing, morphology and corpus linguistics.
Last update: T_UFAL (10.05.2001)
Seznámení s hlavními obory počítačové lingvistiky a s problémy, které tyto obory řeší. Důraz je kladen na zejména na strojový překlad, syntaktickou analýzu, morfologii a korpusovou lingvistiku.
Course completion requirements -
Last update: doc. RNDr. Vladislav Kuboň, Ph.D. (15.10.2017)
The course finishes with a written exam. It contains 8-10 questions which concern the topics covered in lectures. One of the questions requires a detailed description of one of the algorithms described in the course of the semester.
Last update: doc. RNDr. Vladislav Kuboň, Ph.D. (15.10.2017)
Předmět je zakončen písemnou zkouškou, která obsahuje otázky z témat odpřednesených v průběhu semestru. Počet otázek je 8-10, jedna z nich vyžaduje rozsáhlejší odpověď a týká se popisu některého z přednesených algoritmů.
Literature -
Last update: doc. RNDr. Vladislav Kuboň, Ph.D. (21.05.2007)
R. Grishman. Computational Linguistics: An Introduction. ACL Studies in Nantural Language Processing. Cambridge University Press, 1986.
B. Grosz, K. Sparck-Jones and B.L. Webber (eds.). Readings in Natural Language Processing. Morgan Kaufmann, los Altos, CA, 1986.
R. Hauser. Introduction to NLP. Springer-Verlag, 1987
KIRSCHNER. Z. (1983). MOSAIC - A Method of Automatic Extraction of Significant Terms from Texts. Praha : MFF UK, 1983. 124 s.
Králíková, K., Panevová, J. (1990). "ASIMUT - A Method for Automatic Information Retrieval from Full Texts", Explizite Beschreibung der Sprache und automatische Textbearbeitung XVII, Faculty of Mathematics and Physics, Charles University, Prague.
Jan Hajič, Alena Böhmová, Eva Hajičová, Barbora Vidová Hladká: "The Prague Dependency Treebank: A Three-Level Annotation Scenario". In: A. Abeillé (ed.): Treebanks: Building and Using Parsed Corpora, Amsterdam:Kluwer, 2000, pp. 103-127
Last update: RNDr. Pavel Zakouřil, Ph.D. (05.08.2002)
R. Grishman. Computational Linguistics: An Introduction. ACL Studies in Nantural Language Processing. Cambridge University Press, 1986.
P. Sgall. E. Hajičová and J. Panevová. Učíme stroje česky. Academia. P. Sgall a kolektiv. Úvod do syntaxe a sémantiky. Academia. 1986.
W. Clocksin and C. Mellish. Programming in Prolog. Springer-Verlag, Berlin, 2nd edition, 1984 (existuje také v českém překladu)
G. Gazdar and C. Mellish. Natural Language processing in Prolog. Addison Wesley, Wokingham, England, 1989.
M. Covington. NLP for Prolog Programmers. Prentice Hall. 1993.
B. Grosz, K. Sparck-Jones and B.L. Webber (eds.). Readings in Natural Language Processing. Morgan Kaufmann, los Altos, CA, 1986.
R. Hauser. Introduction to NLP. Springer-Verlag, 1987
Syllabus -
Last update: doc. RNDr. Vladislav Kuboň, Ph.D. (21.05.2007)
7. Corpora - Brown corpus, PennTreebank, Czech National Corpus, Prague Dependency Treebank
8. Statistical methods
9. Introduction to semantics
10. Wordnet and ontologies
11. Stock of Shared Knowledge
Last update: T_UFAL (16.05.2002)
1. Úvod, přehled podoborů počítačové lingvistiky a jejich obsah
2. Přirozený jazyk, jeho funkce a struktura
3. Zpracování jazyka na úrovni znaků, metody korekce překlepů
4. ASIMUT = metoda automatického skloňování českých slov
5. Syntaxe jazyka, přehled hlavních způsobů jejího formálního zachycení
6. Statistické metody v syntaxi a morfologii
7. Automatický překlad.
8. Jevy v přirozeném jazyce za hranicemi syntaxe, problematika zachycení těchto jevů, roviny popisu, logický zápis významu a smyslu vět, pravdivostní podmínky, užití jazyka v komunikaci, komunikační záměr a promluvový akt.
9. Od věty k souvislému projevu v přirozeném jazyce (mluvený a psaný diskurz, dialog), koreferenční mezivětné vztahy, užití zájmen a jiných prostředků zkráceného vyjádření.
10. Praktické problémy s automatizovaným zpracováním mezivětných koreferenčních vztahů na příkladech automatického překladu, dobývání informací z textu a uživatelského rozhraní v přirozeném jazyce.
11. Od věty k jejímu obsahu a zase zpět, reprezentace znalostí, odkazování, inference jako součást interpretace přirozeného jazyka.
12. Využití reprezentace znalostí v systémech pro automatizované vyhledávání v textech, dobývání informací z textů a automatizovanou tvorbu textů.
13. Přehled existujících systémů pro automatizované zpracování přirozeného jazyka podle hlavních metod, dosažené výsledky.
14. Formální prostředky vyvinuté pro popis souvislého projevu v přirozeném jazyce, reprezentace kontextu a jeho dynamického obohacování.