Počítačové zpracování starých textu
Název práce v češtině: | Počítačové zpracování starých textu |
---|---|
Název v anglickém jazyce: | Computer Processing of Old Texts |
Akademický rok vypsání: | 2006/2007 |
Typ práce: | diplomová práce |
Jazyk práce: | |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | RNDr. Kiril Ribarov, Ph.D. |
Řešitel: | |
Datum odevzdání tištěné podoby: | 01.06.2007 |
Zásady pro vypracování |
Tato práce je převáľně implementačního charakteru a bude vycházet z předchozích prácí týkající se softwarového prostředí ACT pro zpracování a anotaci jazykových textů vč. textů starých či poąkozených (naprogramované v Javě, vyuľívající různé SQL servery, JSP technologie apod.). Diplomant bude mít k dispozici moľnost přímo konzultovat s dosavadními autory systému a téľ i s lingvistickými uľivateli jak v ČR tak i v zahraničí. Cílem práce bude zdokonalení existujících modulů, případně implementace nových a to předevąím v následujících oblastech:
- ukládání, modifikace, anotace a vyhledávání jazykových dat; _ - aktualizace XML, jeho úprava a validace - vyuľití předem ručně zpracovaných lexikografických kartotéčních údajů pro urychlení anotačních kroků a pro rekonstrukci textů. - Modularizace systému, otázky přenositelnosti kódu a dat Implementace má být v Javě či v prostředí s Javou slučitelným. |
Seznam odborné literatury |
1. Bradley, Neil: XML, kompletní průvodce.
2. Flanagan, David: Java in a Nutshell. (druhé vydání). 3. Bubník, Jiří: Automatizované značkování (středověkých) textů - heslová slova, morfologie, komplexy, korelace. MFF UK, 2004. 4. Čelák, Jiří: Automatizovaná segmentace, rozepisování, a správa běľných vstupů a výstupů pro zpracování (středověkých) textů. MFF UK, 2004. 5. ACT - Softwarový projekt, MFF UK, 2003. |