Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Nástroj pro testování algoritmů pro učení jazyků
Název práce v češtině: Nástroj pro testování algoritmů pro učení jazyků
Název v anglickém jazyce: A tool for testing of algorithms for learning languages
Akademický rok vypsání: 2007/2008
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Knihovna fakulty (32-KNIH)
Vedoucí / školitel: RNDr. Petr Hoffmann, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 27.12.2007
Datum zadání: 27.12.2007
Datum a čas obhajoby: 22.06.2009 00:00
Datum odevzdání elektronické podoby:22.06.2009
Datum proběhlé obhajoby: 22.06.2009
Oponenti: RNDr. Mgr. Marek Kukačka
 
 
 
Zásady pro vypracování
Aplikace umožní testování kvalit externích algoritmů pro učení vybraných tříd jazyků (podporována bude alespoň třída bezkontextových jazyků). Bude určena pro vědecké pracovníky vyvíjející učící algoritmy, kteří potřebují otestovat své postupy různými statistickými metodami.

Učícím algoritmem se zde rozumí algoritmus, který na základě trénovacích dat (např. příkladů a protipříkladů slov cílového jazyka) vytvoří popis (např. v podobě gramatiky či automatu) jazyka z dané třídy jazyků. Kritérium úspěšnosti učícího algoritmu bude dáno testovací metodou - může záviset na schopnostech výsledného automatu klasifikovat řádně náhodná testovací data, konzistenci automatu s trénovacími daty, velikosti jeho reprezentace a podobně.

Uživatel dodá externí program, který jako vstup očekává trénovací data v pevném formátu a na výstupu vydává popis jazyka v pevném formátu (např. zápis automatu či gramatiky). V aplikaci si bude moci vybrat způsob testování dodaného programu - implementováno bude několik různých metod. Aplikace například opakovaně nageneruje trénovací data, předá je externímu programu, vyhodnotí výsledné automaty či gramatiky a vypočte statistické údaje - například vykreslí graf vývoje kvalit výstupů s rostoucí složitostí trénovacích dat. Aplikace umožní uložení statistik ve formátu vhodném pro vložení do publikací (např. obrázek či LaTeXový kód).

Návrh učícího algoritmu není předmětem práce.
Seznam odborné literatury
P. Dupont. Regular grammatical inference from positive and negative samples by genetic search: the gig method. In Grammatical Inference and Applications, Second International Colloquium, ICGI-94, Proceedings, Berlin. Springer. 1994.

P. Hoffmann. Učenie reštartovacích automatov genetickými algoritmami. Master thesis, MFF UK, 2003.

K. J. Lang, B. A. Pearlmutter, and R. Price. Results of the Abbadingo One DFA learning competition and a new evidence driven state merging algorithm. In Fourth International Colloquium on Grammatical Inference (ICGI-98), Lecture Notes in Computer Science, 1998.

Marc M. Lankhorst. A Genetic Algorithm for the Induction of Nondeterministic Pushdown Automata. Technical Report, University of Groningen, Number CS-R 95-2, 1995.

J. T. McClave, F. H. Dietrich. Statistics. 4th ed. San Francisco : Dellen publishing company, c1988. ISBN 0-02-379260-4.
Předběžná náplň práce
Nástroj pro testování externích algoritmů pro učení vybraných tříd jazyků.
Předběžná náplň práce v anglickém jazyce
A tool for testing of external algorithms for learning selected classes of languages.
 
Univerzita Karlova | Informační systém UK