PředmětyPředměty(verze: 811)
Předmět, akademický rok 2017/2018
   Přihlásit přes CAS
Morfologická a syntaktická analýza - NPFL094
Anglický název: Morphological and Syntactic Analysis I
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2017
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:2/0 KZ [hodiny/týden]
Počet míst: neomezen
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština, angličtina
Způsob výuky: prezenční
Další informace: http://ufal.mff.cuni.cz/course/npfl094
Garant: RNDr. Daniel Zeman, Ph.D.
Třída: Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika
Anotace -
Poslední úprava: T_UFAL (28.04.2015)

Základní metody a algoritmy používané pro morfematickou segmentaci, morfologickou a syntaktickou (složkovou, závislostní, tektogramatickou) analýzu přirozeného jazyka. Některé přístupy si v průběhu semestru formou miniprojektů vyzkoušíme v praxi na neznámém jazyku. Klasifikovaný zápočet bude udělován za samostatnou práci na těchto miniprojektech. Na tento předmět v letním semestru navazuje NPFL105 Morfologická a syntaktická analýza II, kde se na analýzu jednoho vybraného jazyka podíváme podrobně.
Podmínky zakončení předmětu -
Poslední úprava: RNDr. Daniel Zeman, Ph.D. (07.10.2017)

Zápočet se uděluje za vypracování domácích úkolů zadaných v průběhu semestru. Typický úkol spočívá ve zpracování jazykových dat, součástí řešení jsou jednak zpracovaná data, jednak programové nástroje, které student k jejich zpracování vytvořil. Každý úkol má svou bodovou dotaci podle odhadované náročnosti. Každý úkol má také stanovený termín odevzdání mailem. Úkoly je možné odevzdat i po termínu, ale za pozdě odevzdané řešení nelze získat plný počet bodů. Všechna řešení je nicméně nutné odevzdat do konce zimního zkouškového období; tento termín lze překročit pouze po předchozí dohodě s vyučujícím.

Pokud řešení nezískalo plný počet bodů (i) z jiných důvodů než kvůli pozdnímu odevzdání, má student možnost odevzdat opravné řešení, kde zohlední výhrady vyučujícího. Opravné řešení bude hodnoceno, jako kdyby šlo o první řešení odevzdané po termínu.

Zápočet je klasifikovaný, výsledná známka se stanoví podle celkového počtu získaných bodů. Budou zadány nejméně tři domácí úkoly a bodový systém bude nastaven tak, aby k získání známky 1 („výborně“) stačil plný počet bodů ze dvou úkolů.

Individuálně je možné s vyučujícím dohodnout i jiný způsob splnění předmětu, např. vypracováním jednoho většího semestrálního projektu místo několika menších úkolů.

Literatura -
Poslední úprava: T_UFAL (28.04.2015)

James Allen: Natural Language Understanding. The Benjamin/Cummings Publishing Company, Inc.; Redwood City, California,1994. ISBN 0-8053-0334-0.

Adolf Erhart: Základy jazykovědy. Státní pedagogické nakladatelství; Praha, 1990

Kimmo Koskenniemi: Two-level Morphology: A General Computational Model for Word-form Recognition and Production. University of Helsinki, Department of General Linguistics, Publications No. 11; Helsinki, 1983

Kenneth R. Beesley, Lauri Karttunen: Finite State Morphology. CSLI Publications, 2003

Jan Hajič: Unification Morfology Grammar (doktorandská práce). Univerzita Karlova, Praha, 1994

Richard Sproat: Morphology and Computation. Massachusetts Institute of Technology, Cambridge, Massachusetts, 1992

Stuart Shieber: An Introduction to Unification-based Approaches to Grammar. CSLI Lecture Notes No. 4, Stanford, California, 1986

Kenneth R. Beesley, Lauri Karttunen: Finite State Morphology. CSLI Publications, 2003

Sylabus -
Poslední úprava: T_UFAL (10.05.2010)

1. Sady morfosyntaktických značek, definice problémů, chunking, frázové a závislostní stromy.

2. Řízená a neřízená morfematická segmentace.

3. Dvojúrovňová morfologie.

4. Bezkontextové gramatiky a chart parser, využití pro morfologickou analýzu.

5. Unifikační gramatiky pro morfologickou analýzu.

6. Zjednoznačnění morfologie (značkování).

7. Syntaktická analýza a regulární výrazy.

8. Pravděpodobnostní bezkontextové gramatiky a chart parser pro syntaktickou analýzu. Collinsův a Charniakův parser.

9. Závislostní syntaktická analýza, neprojektivity, MST parser, Malt parser.

10. Kombinace parserů.

 
Univerzita Karlova | Informační systém UK