Thesis (Selection of subject)Thesis (Selection of subject)(version: 390)
Thesis details
   Login via CAS
Nástroj pro testování algoritmů pro učení jazyků
Thesis title in Czech: Nástroj pro testování algoritmů pro učení jazyků
Thesis title in English: A tool for testing of algorithms for learning languages
Academic year of topic announcement: 2007/2008
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Library (32-KNIH)
Supervisor: RNDr. Petr Hoffmann, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 27.12.2007
Date of assignment: 27.12.2007
Date and time of defence: 22.06.2009 00:00
Date of electronic submission:22.06.2009
Date of proceeded defence: 22.06.2009
Opponents: RNDr. Mgr. Marek Kukačka
 
 
 
Guidelines
Aplikace umožní testování kvalit externích algoritmů pro učení vybraných tříd jazyků (podporována bude alespoň třída bezkontextových jazyků). Bude určena pro vědecké pracovníky vyvíjející učící algoritmy, kteří potřebují otestovat své postupy různými statistickými metodami.

Učícím algoritmem se zde rozumí algoritmus, který na základě trénovacích dat (např. příkladů a protipříkladů slov cílového jazyka) vytvoří popis (např. v podobě gramatiky či automatu) jazyka z dané třídy jazyků. Kritérium úspěšnosti učícího algoritmu bude dáno testovací metodou - může záviset na schopnostech výsledného automatu klasifikovat řádně náhodná testovací data, konzistenci automatu s trénovacími daty, velikosti jeho reprezentace a podobně.

Uživatel dodá externí program, který jako vstup očekává trénovací data v pevném formátu a na výstupu vydává popis jazyka v pevném formátu (např. zápis automatu či gramatiky). V aplikaci si bude moci vybrat způsob testování dodaného programu - implementováno bude několik různých metod. Aplikace například opakovaně nageneruje trénovací data, předá je externímu programu, vyhodnotí výsledné automaty či gramatiky a vypočte statistické údaje - například vykreslí graf vývoje kvalit výstupů s rostoucí složitostí trénovacích dat. Aplikace umožní uložení statistik ve formátu vhodném pro vložení do publikací (např. obrázek či LaTeXový kód).

Návrh učícího algoritmu není předmětem práce.
References
P. Dupont. Regular grammatical inference from positive and negative samples by genetic search: the gig method. In Grammatical Inference and Applications, Second International Colloquium, ICGI-94, Proceedings, Berlin. Springer. 1994.

P. Hoffmann. Učenie reštartovacích automatov genetickými algoritmami. Master thesis, MFF UK, 2003.

K. J. Lang, B. A. Pearlmutter, and R. Price. Results of the Abbadingo One DFA learning competition and a new evidence driven state merging algorithm. In Fourth International Colloquium on Grammatical Inference (ICGI-98), Lecture Notes in Computer Science, 1998.

Marc M. Lankhorst. A Genetic Algorithm for the Induction of Nondeterministic Pushdown Automata. Technical Report, University of Groningen, Number CS-R 95-2, 1995.

J. T. McClave, F. H. Dietrich. Statistics. 4th ed. San Francisco : Dellen publishing company, c1988. ISBN 0-02-379260-4.
Preliminary scope of work
Nástroj pro testování externích algoritmů pro učení vybraných tříd jazyků.
Preliminary scope of work in English
A tool for testing of external algorithms for learning selected classes of languages.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html