Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 390)
Detail práce
   Přihlásit přes CAS
Rozpoznávání číslovek v českém textu
Název práce v češtině: Rozpoznávání číslovek v českém textu
Název v anglickém jazyce: Recognition of numerals in Czech texts
Akademický rok vypsání: 2006/2007
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Jaroslava Hlaváčová, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 13.11.2006
Datum zadání: 13.11.2006
Datum a čas obhajoby: 25.06.2007 00:00
Datum odevzdání elektronické podoby:25.06.2007
Datum proběhlé obhajoby: 25.06.2007
Oponenti: Mgr. Jan Štěpánek, Ph.D.
 
 
 
Zásady pro vypracování
Cílem bakalářské práce je sestavit nástroj, který rozpozná číslovky v českém textu a přiřadí jim jednotný standardní tvar - číslovku zapsanou číslicemi.
Problém má dvě části -
- rozpoznání číslovek zapsaných číslicemi: potíž je v několika možných oddělovačích mezi tisíci, v zápisech desetinných čísel - desetinná tečka/čárka.
- rozpoznání číslovek zapsaných slovy: existují sice pravidla, jak číslovky zapisovat, ale skutečných způsobů zápisu je více. Problém je hlavně ve víceslovnosti takových zápisů.
Seznam odborné literatury
Hajič, Jan: Disambiguation of Rich Inflection. (Computational Morphology of Czech). Karolinum, Prague 2001.

Mluvnice češtiny. Academia 1986
 
Univerzita Karlova | Informační systém UK