Cvičebnice dotazů nad Pražským závislostním korpusem
Název práce v češtině: | Cvičebnice dotazů nad Pražským závislostním korpusem |
---|---|
Název v anglickém jazyce: | Exercise book for querying the Prague Dependency Treebank |
Akademický rok vypsání: | 2008/2009 |
Typ práce: | diplomová práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Řešitel: |
Seznam odborné literatury |
1. Manuály k anotaci jednotlivých rovin PDT 2.0,
http://ufal.mff.cuni.cz/pdt2.0/doc/pdt-guide/en/html/ch05.html 2. Žabokrtský, Z., Pajas, P.: btred/ntred tutorial, http://ufal.mff.cuni.cz/pdt2.0/doc/tools/tred/bn-tutorial.html |
Předběžná náplň práce |
Pražský závislostní korpus (Prague Dependency Treebank, PDT) je
elektronický soubor českých textů obohacený o bohatou, ručně značkovanou morfologickou, syntaktickou i sémantickou informaci. Cílem práce je vytvořit výukový materiál, který začínajícím uživatelům PDT umožní postupné seznámení s tím, jaké lingvisticky relevantní jevy lze v PDT vyhledávat. Součástí práce budou vzorové implementace dotazů v programovacím jazyku Perl v prostředí btred/ntred. |
Předběžná náplň práce v anglickém jazyce |
The Prague Dependency Treebank (PDT) is an electronic collection of Czech
texts enriched with rich, manually tagged morphological, syntactic, and semantic information. The goal of the work is to create a teaching material which should allow new PDT users to gradually learn what kind of linguistically relevant queries can be formulated for the PDT data and how to implement them. The work should include sample implementation of the queries in programming language Perl and btred/ntred environment. |