Jazykově nezávislé rozhraní pro morfologické značky
Název práce v češtině: | Jazykově nezávislé rozhraní pro morfologické značky |
---|---|
Název v anglickém jazyce: | Language universal interface for morphological tags |
Klíčová slova: | morfologie přirozeného jazyka, sada značek, objektové rozhraní |
Klíčová slova anglicky: | natural language morphology, tagset, object-oriented interface |
Akademický rok vypsání: | 2011/2012 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 23.10.2011 |
Datum zadání: | 25.10.2011 |
Datum potvrzení stud. oddělením: | 03.11.2011 |
Konzultanti: | RNDr. Daniel Zeman, Ph.D. |
Zásady pro vypracování |
Pro řadu jazyků dnes existují morfologicky značkované korpusy. Přenositelnost softwarových nástrojů využívajících tato data je však omezená, neboť sady značek vzniklé historickým vývojem pro jednotlivé jazyky se často liší v mnoha technických i lingvistických aspektech, a to i pro typologicky velice blízké jazyky.
Student se seznámí s existujícími systémy pro značkování morfologických kategorií a s předcházejícími pokusy o jejich standardizaci. Hlavním cílem práce je navrhnout co nejuniverzálnější objektově orientované rozhraní pro přístup k morfologickým kategoriím, implementovat toto rozhraní v jazyce Perl a ověřit jeho použitelnost na několika desítkách jazyků. |
Seznam odborné literatury |
Daniel Zeman: Reusable Tagset Conversion Using Tagset Drivers. In: Proceedings of the Language Resources and Evaluation Conference, LREC 2008
Joan Bybee. 1985. Morphology: A Study of the Relation between Meaning and Form. Amsterdam: John Benjamins. Damian Conway: Perl Best Practices, Standards and Styles for Developing Maintainable Code. O'Reilly Media, 2005. Slav Petrov, Dipanjas Das, and Ryan McDonald: A Universal Part-of-Speech Tagset. http://arxiv.org/abs/1104.2086, 2011. |