Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 381)
Detail práce
   Přihlásit přes CAS
Detekce podezřelých anotací
Název práce v češtině: Detekce podezřelých anotací
Název v anglickém jazyce: A suspected annotation detection
Klíčová slova: anotace, detekce chyb, strojové učení
Klíčová slova anglicky: annotation, error detection, machine learning
Akademický rok vypsání: 2010/2011
Typ práce: bakalářská práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Mgr. Barbora Vidová Hladká, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 13.01.2011
Datum zadání: 17.01.2011
Datum a čas obhajoby: 20.06.2011 09:00
Datum odevzdání elektronické podoby:29.05.2011
Datum odevzdání tištěné podoby:29.05.2011
Datum proběhlé obhajoby: 20.06.2011
Oponenti: RNDr. Jiří Hana, Ph.D.
 
 
 
Zásady pro vypracování
Cílem bakalářské práce je navrhnout a implementovat proceduru, která bude odhalovat "podezřelé" anotace v ručních i automatických morfologických a syntaktických anotacích. Anotace bude klasifikována jako „podezřelá“, pokud dle stanovené míry nedosáhne stanoveného prahu správnosti. Procedura bude vycházet z několika vybraných přístupů strojového učení, zejména ze třída tzv. instance-based classifiers. K evaluaci výstupu procedury bude použit anotační nástroj Lexical annotation workbench. Pražský závislostní korpus 2.0 a Český akademický korpus 2.0 budou použity jako trénovaní a testovací data.
Seznam odborné literatury
David W. Aha, Dennis Kibler, Marc K. Albert. Instance-Based Learning Algorithms. Machine Learning Journal, vol. 6, issue 1, 1991.

Czech Academic Corpus 2.0., http://ufal.mff.cuni.cz/rest/CAC/cac_20.html.

Jirka Hana. Lexical annotation workbench, http://ufal.mff.cuni.cz/~hana/law.html.

Barbora Hladká, Jiří Králík: Proměny Českého akademického korpusu, Slovo a slovesnost 67:179-194, 2006.

Barbora Hladká a kol.: Průvodce Českým akademickým korpusem 1.0, Karolinum, 2007.

Prague Dependency Treebank 2.0, http://ufal.mff.cuni.cz/pdt2.0.

 
Univerzita Karlova | Informační systém UK