Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Rozpoznávání číslovek v českém textu
Thesis title in Czech: Rozpoznávání číslovek v českém textu
Thesis title in English: Recognition of numerals in Czech texts
Academic year of topic announcement: 2006/2007
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: RNDr. Jaroslava Hlaváčová, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 13.11.2006
Date of assignment: 13.11.2006
Date and time of defence: 25.06.2007 00:00
Date of electronic submission:25.06.2007
Date of proceeded defence: 25.06.2007
Opponents: Mgr. Jan Štěpánek, Ph.D.
 
 
 
Guidelines
Cílem bakalářské práce je sestavit nástroj, který rozpozná číslovky v českém textu a přiřadí jim jednotný standardní tvar - číslovku zapsanou číslicemi.
Problém má dvě části -
- rozpoznání číslovek zapsaných číslicemi: potíž je v několika možných oddělovačích mezi tisíci, v zápisech desetinných čísel - desetinná tečka/čárka.
- rozpoznání číslovek zapsaných slovy: existují sice pravidla, jak číslovky zapisovat, ale skutečných způsobů zápisu je více. Problém je hlavně ve víceslovnosti takových zápisů.
References
Hajič, Jan: Disambiguation of Rich Inflection. (Computational Morphology of Czech). Karolinum, Prague 2001.

Mluvnice češtiny. Academia 1986
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html