Webové rozhraní pro platformu Treex
Název práce v češtině: | Webové rozhraní pro platformu Treex |
---|---|
Název v anglickém jazyce: | Web Interface for the Treex Framework |
Klíčová slova: | Treex, Treex::Web, NLP framework, Perl, Catalyst, REST, webové služby |
Klíčová slova anglicky: | Treex, Treex::Web, NLP framework, Perl, Catalyst, REST, web services |
Akademický rok vypsání: | 2011/2012 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | Mgr. Martin Popel, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 22.02.2012 |
Datum zadání: | 22.02.2012 |
Datum potvrzení stud. oddělením: | 06.03.2012 |
Datum a čas obhajoby: | 02.09.2013 00:00 |
Datum odevzdání elektronické podoby: | 02.08.2013 |
Datum odevzdání tištěné podoby: | 02.08.2013 |
Datum proběhlé obhajoby: | 02.09.2013 |
Oponenti: | Mgr. Rudolf Rosa, Ph.D. |
Zásady pro vypracování |
Modulární platforma Treex slouží k různým úlohám zpracování přirozeného jazyka: morfologická a syntaktická analýza češtiny, angličtiny i dalších jazyků, syntéza z hloubkové reprezentace vět, strojový překlad, zpracování paralelních (vícejazyčných) dat a další. Student se podrobně seznámí s touto platformou a navrhne a implementuje pro ni webové rozhraní.
Toto webové rozhraní bude primárně určeno pro seznámení s platformou Treex a jejími možnostmi, zároveň však bude umožňovat i spouštění složitějších úloh. Uživatelé budou moci zadat vlastní vstupní data (textové soubory, webové stránky, soubory ve formátech treex, conll a dalších) a spustit nad nimi některou z vybraných aplikací (minimálně analýzu češtiny a angličtiny na analytickou a tektogramatickou rovinu). Bude také možné si sestavit vlastní aplikaci (tzv. "scénář") z modulů (tzv. "bloků"), které jsou již implementovány v Treexu. Výstupní data půjde stáhnout na disk i zobrazit přímo v prohlížeči, zejména jako závislostní stromy jednotlivých vět (nejspíš ve formátu SVG). Vzhledem k tomu, že Treex je naprogramován v jazyce Perl, preferovaným řešením je naprogramovat i webové rozhraní v tomto jazyce (např. ve frameworku Catalyst). Práce si vyžádá i úpravy platformy Treex, aby vyhovovala požadavkům moderní webové aplikace. |
Seznam odborné literatury |
Dokumentace platformy Treex http://search.cpan.org/perldoc?Treex::Core
Martin Popel, Zdeněk Žabokrtský: TectoMT: Modular NLP Framework. In Proceedings of IceTAL, 7th International Conference on Natural Language Processing, Reykjavík, Iceland, August 17, 2010, pp. 293–304. Programovací manuály a informace k Perl, Catalyst, MySQL/Postgress, Javascript, CSS, XHTML/XML, JQuery a další dle potřeby. |