Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Language Resources for Yoruba
Název práce v češtině: Jazykové zdroje pro jorubštinu
Název v anglickém jazyce: Language Resources for Yoruba
Klíčová slova: jorubština, nigerokonžské jazyky, morfologie, závislostní syntaxe
Klíčová slova anglicky: Yoruba, Niger-Congo languages, morphology, dependency syntax
Akademický rok vypsání: 2019/2020
Typ práce: disertační práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Daniel Zeman, Ph.D.
Řešitel: skrytý - zadáno vedoucím/školitelem
Datum přihlášení: 08.10.2019
Datum zadání: 08.10.2019
Zásady pro vypracování
The core of the work will be design of annotation guidelines specific for Yoruba, within the Universal Dependencies framework, and creation of annotated data that enable training of at least a small model for automatic tokenization, tagging and dependency parsing of this language.

Jádrem práce bude návrh anotačních pravidel specifických pro jorubštinu v rámci formalismu Universal Dependencies, a tvorba anotovaných dat umožňujících natrénování alespoň malého modelu pro automatickou tokenizaci, značkování a závislostní syntaktickou analýzu tohoto jazyka.
Seznam odborné literatury
Joakim Nivre, Marie-Catherine de Marneffe, Filip Ginter, Yoav Goldberg, Jan Hajič, Christopher D. Manning, Ryan McDonald, Slav Petrov, Sampo Pyysalo, Natalia Silveira, Reut Tsarfaty, Daniel Zeman. 2016. Universal Dependencies v1: A Multilingual Treebank Collection. In Proceedings of LREC.
 
Univerzita Karlova | Informační systém UK