Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Počítačové zpracování starých textu

Název práce v češtině:	Počítačové zpracování starých textu
Název v anglickém jazyce:	Computer Processing of Old Texts
Akademický rok vypsání:	2006/2007
Typ práce:	diplomová práce
Jazyk práce:
Ústav:	Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel:	RNDr. Kiril Ribarov, Ph.D.
Řešitel:
Datum odevzdání tištěné podoby:	01.06.2007

Zásady pro vypracování

Tato práce je převáľně implementačního charakteru a bude vycházet z předchozích prácí týkající se softwarového prostředí ACT pro zpracování a anotaci jazykových textů vč. textů starých či poąkozených (naprogramované v Javě, vyuľívající různé SQL servery, JSP technologie apod.). Diplomant bude mít k dispozici moľnost přímo konzultovat s dosavadními autory systému a téľ i s lingvistickými uľivateli jak v ČR tak i v zahraničí. Cílem práce bude zdokonalení existujících modulů, případně implementace nových a to předevąím v následujících oblastech:
- ukládání, modifikace, anotace a vyhledávání jazykových dat; _
- aktualizace XML, jeho úprava a validace
- vyuľití předem ručně zpracovaných lexikografických kartotéčních údajů pro urychlení anotačních kroků a pro rekonstrukci textů.
- Modularizace systému, otázky přenositelnosti kódu a dat
Implementace má být v Javě či v prostředí s Javou slučitelným.

Seznam odborné literatury

1. Bradley, Neil: XML, kompletní průvodce.
2. Flanagan, David: Java in a Nutshell. (druhé vydání).
3. Bubník, Jiří: Automatizované značkování (středověkých) textů - heslová slova, morfologie, komplexy, korelace. MFF UK, 2004.
4. Čelák, Jiří: Automatizovaná segmentace, rozepisování, a správa běľných vstupů a výstupů pro zpracování (středověkých) textů. MFF UK, 2004.
5. ACT - Softwarový projekt, MFF UK, 2003.