Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Jazykově nezávislé rozhraní pro morfologické značky
Název práce v češtině: Jazykově nezávislé rozhraní pro morfologické značky
Název v anglickém jazyce: Language universal interface for morphological tags
Klíčová slova: morfologie přirozeného jazyka, sada značek, objektové rozhraní
Klíčová slova anglicky: natural language morphology, tagset, object-oriented interface
Akademický rok vypsání: 2011/2012
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Ing. Zdeněk Žabokrtský, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 23.10.2011
Datum zadání: 25.10.2011
Datum potvrzení stud. oddělením: 03.11.2011
Konzultanti: RNDr. Daniel Zeman, Ph.D.
Zásady pro vypracování
Pro řadu jazyků dnes existují morfologicky značkované korpusy. Přenositelnost softwarových nástrojů využívajících tato data je však omezená, neboť sady značek vzniklé historickým vývojem pro jednotlivé jazyky se často liší v mnoha technických i lingvistických aspektech, a to i pro typologicky velice blízké jazyky.

Student se seznámí s existujícími systémy pro značkování morfologických kategorií a s předcházejícími pokusy o jejich standardizaci. Hlavním cílem práce je navrhnout co nejuniverzálnější objektově orientované rozhraní pro přístup k morfologickým kategoriím, implementovat toto rozhraní v jazyce Perl a ověřit jeho použitelnost na několika desítkách jazyků.
Seznam odborné literatury
Daniel Zeman: Reusable Tagset Conversion Using Tagset Drivers. In: Proceedings of the Language Resources and Evaluation Conference, LREC 2008
Joan Bybee. 1985. Morphology: A Study of the Relation between Meaning and Form. Amsterdam: John Benjamins.
Damian Conway: Perl Best Practices, Standards and Styles for Developing Maintainable Code. O'Reilly Media, 2005.
Slav Petrov, Dipanjas Das, and Ryan McDonald: A Universal Part-of-Speech Tagset. http://arxiv.org/abs/1104.2086, 2011.
 
Univerzita Karlova | Informační systém UK