Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Počítačové zpracování starých textu
Název práce v češtině: Počítačové zpracování starých textu
Název v anglickém jazyce: Computer Processing of Old Texts
Akademický rok vypsání: 2006/2007
Typ práce: diplomová práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Kiril Ribarov, Ph.D.
Řešitel:
Datum odevzdání tištěné podoby:01.06.2007
Zásady pro vypracování
Tato práce je převáľně implementačního charakteru a bude vycházet z předchozích prácí týkající se softwarového prostředí ACT pro zpracování a anotaci jazykových textů vč. textů starých či poąkozených (naprogramované v Javě, vyuľívající různé SQL servery, JSP technologie apod.). Diplomant bude mít k dispozici moľnost přímo konzultovat s dosavadními autory systému a téľ i s lingvistickými uľivateli jak v ČR tak i v zahraničí. Cílem práce bude zdokonalení existujících modulů, případně implementace nových a to předevąím v následujících oblastech:
- ukládání, modifikace, anotace a vyhledávání jazykových dat; _
- aktualizace XML, jeho úprava a validace
- vyuľití předem ručně zpracovaných lexikografických kartotéčních údajů pro urychlení anotačních kroků a pro rekonstrukci textů.
- Modularizace systému, otázky přenositelnosti kódu a dat
Implementace má být v Javě či v prostředí s Javou slučitelným.
Seznam odborné literatury
1. Bradley, Neil: XML, kompletní průvodce.
2. Flanagan, David: Java in a Nutshell. (druhé vydání).
3. Bubník, Jiří: Automatizované značkování (středověkých) textů - heslová slova, morfologie, komplexy, korelace. MFF UK, 2004.
4. Čelák, Jiří: Automatizovaná segmentace, rozepisování, a správa běľných vstupů a výstupů pro zpracování (středověkých) textů. MFF UK, 2004.
5. ACT - Softwarový projekt, MFF UK, 2003.
 
Univerzita Karlova | Informační systém UK