Jazykově nezávislé rozhraní pro morfologické značky
Thesis title in Czech: | Jazykově nezávislé rozhraní pro morfologické značky |
---|---|
Thesis title in English: | Language universal interface for morphological tags |
Key words: | morfologie přirozeného jazyka, sada značek, objektové rozhraní |
English key words: | natural language morphology, tagset, object-oriented interface |
Academic year of topic announcement: | 2011/2012 |
Thesis type: | diploma thesis |
Thesis language: | angličtina |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 23.10.2011 |
Date of assignment: | 25.10.2011 |
Confirmed by Study dept. on: | 03.11.2011 |
Advisors: | RNDr. Daniel Zeman, Ph.D. |
Guidelines |
Pro řadu jazyků dnes existují morfologicky značkované korpusy. Přenositelnost softwarových nástrojů využívajících tato data je však omezená, neboť sady značek vzniklé historickým vývojem pro jednotlivé jazyky se často liší v mnoha technických i lingvistických aspektech, a to i pro typologicky velice blízké jazyky.
Student se seznámí s existujícími systémy pro značkování morfologických kategorií a s předcházejícími pokusy o jejich standardizaci. Hlavním cílem práce je navrhnout co nejuniverzálnější objektově orientované rozhraní pro přístup k morfologickým kategoriím, implementovat toto rozhraní v jazyce Perl a ověřit jeho použitelnost na několika desítkách jazyků. |
References |
Daniel Zeman: Reusable Tagset Conversion Using Tagset Drivers. In: Proceedings of the Language Resources and Evaluation Conference, LREC 2008
Joan Bybee. 1985. Morphology: A Study of the Relation between Meaning and Form. Amsterdam: John Benjamins. Damian Conway: Perl Best Practices, Standards and Styles for Developing Maintainable Code. O'Reilly Media, 2005. Slav Petrov, Dipanjas Das, and Ryan McDonald: A Universal Part-of-Speech Tagset. http://arxiv.org/abs/1104.2086, 2011. |