Rozpoznávání číslovek v českém textu
Název práce v češtině: | Rozpoznávání číslovek v českém textu |
---|---|
Název v anglickém jazyce: | Recognition of numerals in Czech texts |
Akademický rok vypsání: | 2006/2007 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | RNDr. Jaroslava Hlaváčová, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 13.11.2006 |
Datum zadání: | 13.11.2006 |
Datum a čas obhajoby: | 25.06.2007 00:00 |
Datum odevzdání elektronické podoby: | 25.06.2007 |
Datum proběhlé obhajoby: | 25.06.2007 |
Oponenti: | Mgr. Jan Štěpánek, Ph.D. |
Zásady pro vypracování |
Cílem bakalářské práce je sestavit nástroj, který rozpozná číslovky v českém textu a přiřadí jim jednotný standardní tvar - číslovku zapsanou číslicemi.
Problém má dvě části - - rozpoznání číslovek zapsaných číslicemi: potíž je v několika možných oddělovačích mezi tisíci, v zápisech desetinných čísel - desetinná tečka/čárka. - rozpoznání číslovek zapsaných slovy: existují sice pravidla, jak číslovky zapisovat, ale skutečných způsobů zápisu je více. Problém je hlavně ve víceslovnosti takových zápisů. |
Seznam odborné literatury |
Hajič, Jan: Disambiguation of Rich Inflection. (Computational Morphology of Czech). Karolinum, Prague 2001.
Mluvnice češtiny. Academia 1986 |