Nástroj pro testování algoritmů pro učení jazyků
Název práce v češtině: | Nástroj pro testování algoritmů pro učení jazyků |
---|---|
Název v anglickém jazyce: | A tool for testing of algorithms for learning languages |
Akademický rok vypsání: | 2007/2008 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Knihovna fakulty (32-KNIH) |
Vedoucí / školitel: | RNDr. Petr Hoffmann, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 27.12.2007 |
Datum zadání: | 27.12.2007 |
Datum a čas obhajoby: | 22.06.2009 00:00 |
Datum odevzdání elektronické podoby: | 22.06.2009 |
Datum proběhlé obhajoby: | 22.06.2009 |
Oponenti: | RNDr. Mgr. Marek Kukačka |
Zásady pro vypracování |
Aplikace umožní testování kvalit externích algoritmů pro učení vybraných tříd jazyků (podporována bude alespoň třída bezkontextových jazyků). Bude určena pro vědecké pracovníky vyvíjející učící algoritmy, kteří potřebují otestovat své postupy různými statistickými metodami.
Učícím algoritmem se zde rozumí algoritmus, který na základě trénovacích dat (např. příkladů a protipříkladů slov cílového jazyka) vytvoří popis (např. v podobě gramatiky či automatu) jazyka z dané třídy jazyků. Kritérium úspěšnosti učícího algoritmu bude dáno testovací metodou - může záviset na schopnostech výsledného automatu klasifikovat řádně náhodná testovací data, konzistenci automatu s trénovacími daty, velikosti jeho reprezentace a podobně. Uživatel dodá externí program, který jako vstup očekává trénovací data v pevném formátu a na výstupu vydává popis jazyka v pevném formátu (např. zápis automatu či gramatiky). V aplikaci si bude moci vybrat způsob testování dodaného programu - implementováno bude několik různých metod. Aplikace například opakovaně nageneruje trénovací data, předá je externímu programu, vyhodnotí výsledné automaty či gramatiky a vypočte statistické údaje - například vykreslí graf vývoje kvalit výstupů s rostoucí složitostí trénovacích dat. Aplikace umožní uložení statistik ve formátu vhodném pro vložení do publikací (např. obrázek či LaTeXový kód). Návrh učícího algoritmu není předmětem práce. |
Seznam odborné literatury |
P. Dupont. Regular grammatical inference from positive and negative samples by genetic search: the gig method. In Grammatical Inference and Applications, Second International Colloquium, ICGI-94, Proceedings, Berlin. Springer. 1994.
P. Hoffmann. Učenie reštartovacích automatov genetickými algoritmami. Master thesis, MFF UK, 2003. K. J. Lang, B. A. Pearlmutter, and R. Price. Results of the Abbadingo One DFA learning competition and a new evidence driven state merging algorithm. In Fourth International Colloquium on Grammatical Inference (ICGI-98), Lecture Notes in Computer Science, 1998. Marc M. Lankhorst. A Genetic Algorithm for the Induction of Nondeterministic Pushdown Automata. Technical Report, University of Groningen, Number CS-R 95-2, 1995. J. T. McClave, F. H. Dietrich. Statistics. 4th ed. San Francisco : Dellen publishing company, c1988. ISBN 0-02-379260-4. |
Předběžná náplň práce |
Nástroj pro testování externích algoritmů pro učení vybraných tříd jazyků. |
Předběžná náplň práce v anglickém jazyce |
A tool for testing of external algorithms for learning selected classes of languages. |