Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 381)
Detail práce
   Přihlásit přes CAS
Cvičebnice dotazů nad Pražským závislostním korpusem
Název práce v češtině: Cvičebnice dotazů nad Pražským závislostním korpusem
Název v anglickém jazyce: Exercise book for querying the Prague Dependency Treebank
Akademický rok vypsání: 2008/2009
Typ práce: diplomová práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Řešitel:
Seznam odborné literatury
1. Manuály k anotaci jednotlivých rovin PDT 2.0,
http://ufal.mff.cuni.cz/pdt2.0/doc/pdt-guide/en/html/ch05.html

2. Žabokrtský, Z., Pajas, P.: btred/ntred tutorial,
http://ufal.mff.cuni.cz/pdt2.0/doc/tools/tred/bn-tutorial.html
Předběžná náplň práce
Pražský závislostní korpus (Prague Dependency Treebank, PDT) je
elektronický soubor českých textů obohacený o bohatou, ručně značkovanou
morfologickou, syntaktickou i sémantickou informaci. Cílem práce
je vytvořit výukový materiál, který začínajícím uživatelům
PDT umožní postupné seznámení s tím, jaké lingvisticky relevantní
jevy lze v PDT vyhledávat. Součástí práce budou vzorové implementace
dotazů v programovacím jazyku Perl v prostředí btred/ntred.
Předběžná náplň práce v anglickém jazyce
The Prague Dependency Treebank (PDT) is an electronic collection of Czech
texts enriched with rich, manually tagged morphological, syntactic, and semantic information.
The goal of the work is to create a teaching material which should allow
new PDT users to gradually learn what kind of linguistically relevant queries
can be formulated for the PDT data and how to implement them.
The work should include sample implementation
of the queries in programming language Perl and btred/ntred environment.
 
Univerzita Karlova | Informační systém UK