PředmětyPředměty(verze: 945)
Předmět, akademický rok 2023/2024
   Přihlásit přes CAS
Závislostní analýza pomocí treebanku - NSWI105
Anglický název: Dependency Analysis using Treebank
Zajišťuje: Katedra softwaru a výuky informatiky (32-KSVI)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2008
Semestr: letní
E-Kredity: 3
Rozsah, examinace: letní s.:0/2, Z [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: zrušen
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Garant: RNDr. Tomáš Holan, Ph.D.
Třída: Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Počítačová a formální lingvistika, Softwarové inženýrství
Prerekvizity : NPRG031
Výsledky anket   Termíny zkoušek   Rozvrh   Nástěnka   
Anotace -
Poslední úprava: JUDr. Dana Macharová (24.01.2005)
Seminář sestávající jednak z referování článků a dalších textů o dané problematice a jednak z tvorby vlastních analyzátorů a jejich prezentace. K získání zápočtu bude požadováno vytvoření vlastního analyzátoru zpracovávajícího data z Pražského závislostního treebanku. Od účastníků nejsou požadovány žádné předběžné znalosti z lingvistiky, naopak se předpokládá schopnost a ochota programovat.
Literatura
Poslední úprava: T_KSVI (28.03.2006)
Eugene Charniak:
A Maximum-Entropy-Inspired Parser, Proceedings of NAACL-2000

Michael Collins:
Head-Driven Statistical Models for Natural Language Parsing.

PhD Dissertation, University of Pennsylvania, 1999.

Michael Collins, Jan Hajic, Lance Ramshaw and Christoph Tillmann:
A Statistical Parser for Czech. ACL 99.

Daniel M. Bikel:
A Statistical Model for Parsing and Word-Sense Disambiguation,

in the proceedings of the Joint SIGDAT Conference on

Empirical Methods in Natural Language Processing and Very Large Corpora

Daniel Zeman:
Parsing with a Statistical Dependency Model (PhD thesis).

Univerzita Karlova, Praha, 2004.

...a další

Sylabus -
Poslední úprava: T_KSVI (28.03.2006)

1. Základní pojmy: závislostní strom, treebank jako množina stromů, trénovací a testovací množina, míry úspěšnosti.

2. Principy analýzy bezkontextových jazyků, neprojektivita.

3. Stávající přístupy a analyzátory (Charniak, Collins, Bikel, Nivre, Zeman, Žabokrtský, Smrž ...)

4. Tvorba vlastních analyzátorů.

 
Univerzita Karlova | Informační systém UK