PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Morfologická a syntaktická analýza - NPFL094
Anglický název: Morphological and Syntactic Analysis
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2019
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:2/0, KZ [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: angličtina, čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Další informace: http://ufal.mff.cuni.cz/course/npfl094
Garant: RNDr. Daniel Zeman, Ph.D.
Třída: Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Je záměnnost pro: ATKL00343
Anotace -
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (12.05.2020)
Základní metody a algoritmy používané pro morfematickou segmentaci, morfologickou a syntaktickou (složkovou, závislostní) analýzu přirozeného jazyka. Některé přístupy si v průběhu semestru formou miniprojektů vyzkoušíme v praxi. Klasifikovaný zápočet bude udělován za samostatnou práci na těchto miniprojektech.
Podmínky zakončení předmětu -
Poslední úprava: RNDr. Daniel Zeman, Ph.D. (07.10.2017)

Zápočet se uděluje za vypracování domácích úkolů zadaných v průběhu semestru. Typický úkol spočívá ve zpracování jazykových dat, součástí řešení jsou jednak zpracovaná data, jednak programové nástroje, které student k jejich zpracování vytvořil. Každý úkol má svou bodovou dotaci podle odhadované náročnosti. Každý úkol má také stanovený termín odevzdání mailem. Úkoly je možné odevzdat i po termínu, ale za pozdě odevzdané řešení nelze získat plný počet bodů. Všechna řešení je nicméně nutné odevzdat do konce zimního zkouškového období; tento termín lze překročit pouze po předchozí dohodě s vyučujícím.

Pokud řešení nezískalo plný počet bodů (i) z jiných důvodů než kvůli pozdnímu odevzdání, má student možnost odevzdat opravné řešení, kde zohlední výhrady vyučujícího. Opravné řešení bude hodnoceno, jako kdyby šlo o první řešení odevzdané po termínu.

Zápočet je klasifikovaný, výsledná známka se stanoví podle celkového počtu získaných bodů. Budou zadány nejméně tři domácí úkoly a bodový systém bude nastaven tak, aby k získání známky 1 („výborně“) stačil plný počet bodů ze dvou úkolů.

Individuálně je možné s vyučujícím dohodnout i jiný způsob splnění předmětu, např. vypracováním jednoho většího semestrálního projektu místo několika menších úkolů.

Literatura -
Poslední úprava: doc. Mgr. Barbora Vidová Hladká, Ph.D. (29.01.2019)
  • James Allen: Natural Language Understanding. The Benjamin/Cummings Publishing Company, Inc.; Redwood City, California,1994. ISBN 0-8053-0334-0.
  • Adolf Erhart: Základy jazykovědy. Státní pedagogické nakladatelství; Praha, 1990
  • Kimmo Koskenniemi: Two-level Morphology: A General Computational Model for Word-form Recognition and Production. University of Helsinki, Department of General Linguistics, Publications No. 11; Helsinki, 1983
  • Kenneth R. Beesley, Lauri Karttunen: Finite State Morphology. CSLI Publications, 2003
  • Jan Hajič: Unification Morfology Grammar (doktorandská práce). Univerzita Karlova, Praha, 1994
  • Richard Sproat: Morphology and Computation. Massachusetts Institute of Technology, Cambridge, Massachusetts, 1992
  • Stuart Shieber: An Introduction to Unification-based Approaches to Grammar. CSLI Lecture Notes No. 4, Stanford, California, 1986
  • Kenneth R. Beesley, Lauri Karttunen: Finite State Morphology. CSLI Publications, 2003
  • Zeman, Daniel: The World of Tokens, Tags and Trees. Studies in Computational and Theoretical Linguistics, vol. 19. ÚFAL, Praha, 2018, ISBN 978-80-88132-09-7.

Sylabus -
Poslední úprava: RNDr. Daniel Zeman, Ph.D. (05.05.2022)

1. Sady morfosyntaktických značek, definice problémů, slovní druhy.

2. Řízená a neřízená morfematická segmentace, segmentace čínštiny na slova.

3. Konečně-stavová (dvojúrovňová) morfologie.

4. Bezkontextové gramatiky a chart parser, využití pro morfologickou analýzu.

5. Unifikační gramatiky pro morfologickou analýzu.

6. Funkční morfologie.

7. Syntaktická anotace, složkové a závislostní stromy, neprojektivita.

8. Universal Dependencies.

9. Závislostní syntaktická analýza: přechodové parsery, grafové parsery.

 
Univerzita Karlova | Informační systém UK