Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 385)
Detail práce
   Přihlásit přes CAS
Webové rozhraní pro platformu Treex
Název práce v češtině: Webové rozhraní pro platformu Treex
Název v anglickém jazyce: Web Interface for the Treex Framework
Klíčová slova: Treex, Treex::Web, NLP framework, Perl, Catalyst, REST, webové služby
Klíčová slova anglicky: Treex, Treex::Web, NLP framework, Perl, Catalyst, REST, web services
Akademický rok vypsání: 2011/2012
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: Mgr. Martin Popel, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 22.02.2012
Datum zadání: 22.02.2012
Datum potvrzení stud. oddělením: 06.03.2012
Datum a čas obhajoby: 02.09.2013 00:00
Datum odevzdání elektronické podoby:02.08.2013
Datum odevzdání tištěné podoby:02.08.2013
Datum proběhlé obhajoby: 02.09.2013
Oponenti: Mgr. Rudolf Rosa, Ph.D.
 
 
 
Zásady pro vypracování
Modulární platforma Treex slouží k různým úlohám zpracování přirozeného jazyka: morfologická a syntaktická analýza češtiny, angličtiny i dalších jazyků, syntéza z hloubkové reprezentace vět, strojový překlad, zpracování paralelních (vícejazyčných) dat a další. Student se podrobně seznámí s touto platformou a navrhne a implementuje pro ni webové rozhraní.

Toto webové rozhraní bude primárně určeno pro seznámení s platformou Treex a jejími možnostmi, zároveň však bude umožňovat i spouštění složitějších úloh. Uživatelé budou moci zadat vlastní vstupní data (textové soubory, webové stránky, soubory ve formátech treex, conll a dalších) a spustit nad nimi některou z vybraných aplikací (minimálně analýzu češtiny a angličtiny na analytickou a tektogramatickou rovinu). Bude také možné si sestavit vlastní aplikaci (tzv. "scénář") z modulů (tzv. "bloků"), které jsou již implementovány v Treexu. Výstupní data půjde stáhnout na disk i zobrazit přímo v prohlížeči, zejména jako závislostní stromy jednotlivých vět (nejspíš ve formátu SVG).

Vzhledem k tomu, že Treex je naprogramován v jazyce Perl, preferovaným řešením je naprogramovat i webové rozhraní v tomto jazyce (např. ve frameworku Catalyst). Práce si vyžádá i úpravy platformy Treex, aby vyhovovala požadavkům moderní webové aplikace.
Seznam odborné literatury
Dokumentace platformy Treex http://search.cpan.org/perldoc?Treex::Core

Martin Popel, Zdeněk Žabokrtský: TectoMT: Modular NLP Framework. In Proceedings of IceTAL, 7th International Conference on Natural Language Processing, Reykjavík, Iceland, August 17, 2010, pp. 293–304.

Programovací manuály a informace k Perl, Catalyst, MySQL/Postgress, Javascript, CSS, XHTML/XML, JQuery a další dle potřeby.
 
Univerzita Karlova | Informační systém UK