Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 384)
Detail práce
   Přihlásit přes CAS
Určení smysluplnosti české věty na základě syntaktické informace
Název práce v češtině: Určení smysluplnosti české věty na základě syntaktické informace
Název v anglickém jazyce: Syntax-based classification of meaningful Czech sentences
Akademický rok vypsání: 2008/2009
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. Mgr. Barbora Vidová Hladká, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 20.11.2008
Datum zadání: 20.11.2008
Datum a čas obhajoby: 22.06.2009 00:00
Datum odevzdání elektronické podoby:22.06.2009
Datum proběhlé obhajoby: 22.06.2009
Oponenti: doc. RNDr. Ondřej Bojar, Ph.D.
 
 
 
Zásady pro vypracování
Cílem bp je implementace automatické procedury, která v reálném čase rozezná, je-li shluk textových řetězců českou větou. Automatická procedura bude spolupracovat s externími automatickými moduly, které se týkají tvarosloví (pro slova slovní druhy a jejich kategorie - rod, číslo, pád, osoba aj.) a větného rozboru. Práce navazuje na ročníkový projekt, který k určení smyslupnosti využíval pouze tvaroslovné informace. Implementace bude provedena v prostředí C/C++.
Seznam odborné literatury
1, Barbora Vidová Hladká a kol. The Czech Academic Corpus 2.0 - Guide. Prague Bulletin of Mathematical Linguistics 89, pp. 41--96, 2008.
2, Czech Academic Corpus 2.0 http://ufal.mff.cuni.cz/rest/CAC/cac_20.html
Předběžná náplň práce
Určení smysluplnosti vět je zajímavou úlohou v aplikacích počítačového zpracování přirozeného jazyka, např. v internetovém vyhledávání. Smysluplnost vět je vlastnost, kterou nelze definovat univerzálně. Je třeba vymezit rovinu jazykového popisu, vzhledem ke které je smysluplnost určována. V našem řešení sledujeme systém rovin, který vychází od morfologické roviny přes syntaktickou až k sémantické. Bakalářská práce bude pokrývat první dvě roviny. Cílovým jazykem je čeština.
Předběžná náplň práce v anglickém jazyce
Meaningful sentence classification is a very interesting task for the applications of natural language processing, for ex. the web search engines. ´To-be-meaningful´ is a feature that cannot be defined in an absolute way. It is necessary to specify a layer of the natural language description on which the sentence classification will be done. In our approach, we pursue a layer system that goes from the morphological layer through the syntactical layer to the semantic layer - the bachelor thesis will cover the first two of three layers. Czech will be used as the object language.
 
Univerzita Karlova | Informační systém UK