Detekce podezřelých anotací
Název práce v češtině: | Detekce podezřelých anotací |
---|---|
Název v anglickém jazyce: | A suspected annotation detection |
Klíčová slova: | anotace, detekce chyb, strojové učení |
Klíčová slova anglicky: | annotation, error detection, machine learning |
Akademický rok vypsání: | 2010/2011 |
Typ práce: | bakalářská práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Mgr. Barbora Vidová Hladká, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 13.01.2011 |
Datum zadání: | 17.01.2011 |
Datum a čas obhajoby: | 20.06.2011 09:00 |
Datum odevzdání elektronické podoby: | 29.05.2011 |
Datum odevzdání tištěné podoby: | 29.05.2011 |
Datum proběhlé obhajoby: | 20.06.2011 |
Oponenti: | RNDr. Jiří Hana, Ph.D. |
Zásady pro vypracování |
Cílem bakalářské práce je navrhnout a implementovat proceduru, která bude odhalovat "podezřelé" anotace v ručních i automatických morfologických a syntaktických anotacích. Anotace bude klasifikována jako „podezřelá“, pokud dle stanovené míry nedosáhne stanoveného prahu správnosti. Procedura bude vycházet z několika vybraných přístupů strojového učení, zejména ze třída tzv. instance-based classifiers. K evaluaci výstupu procedury bude použit anotační nástroj Lexical annotation workbench. Pražský závislostní korpus 2.0 a Český akademický korpus 2.0 budou použity jako trénovaní a testovací data. |
Seznam odborné literatury |
David W. Aha, Dennis Kibler, Marc K. Albert. Instance-Based Learning Algorithms. Machine Learning Journal, vol. 6, issue 1, 1991.
Czech Academic Corpus 2.0., http://ufal.mff.cuni.cz/rest/CAC/cac_20.html. Jirka Hana. Lexical annotation workbench, http://ufal.mff.cuni.cz/~hana/law.html. Barbora Hladká, Jiří Králík: Proměny Českého akademického korpusu, Slovo a slovesnost 67:179-194, 2006. Barbora Hladká a kol.: Průvodce Českým akademickým korpusem 1.0, Karolinum, 2007. Prague Dependency Treebank 2.0, http://ufal.mff.cuni.cz/pdt2.0. |