Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Určování syntaktické smysluplnosti českých vět
Thesis title in Czech: Určování syntaktické smysluplnosti českých vět
Thesis title in English: Syntactically-based classification of Czech sentences
Academic year of topic announcement: 2008/2009
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. Mgr. Barbora Vidová Hladká, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 26.11.2008
Date of assignment: 26.11.2008
Date and time of defence: 22.06.2009 00:00
Date of electronic submission:22.06.2009
Date of proceeded defence: 22.06.2009
Opponents: RNDr. Jiří Mírovský, Ph.D.
 
 
 
Guidelines
Cílem bp je implementace automatické procedury, která v reálném čase rozezná, je-li shluk textových řetězců gramaticky smysluplnou českou větou. Automatická procedura bude spolupracovat s externími automatickými moduly, které se týkají tvarosloví (pro slova slovní druhy a jejich kategorie - rod, číslo, pád, osoba aj.) a větného rozboru. Práce navazuje na ročníkový projekt, který k určení smyslupnosti využíval pouze tvaroslovné informace. Implementace bude provedena v prostředí C/C++.
References
1, Barbora Vidová Hladká a kol. The Czech Academic Corpus 2.0 - Guide. Prague Bulletin of Mathematical Linguistics 89, pp. 41--96, 2008.
2, Czech Academic Corpus 2.0 http://ufal.mff.cuni.cz/rest/CAC/cac_20.html
Preliminary scope of work
Určení syntakticky smysluplných vět je zajímavou úlohou v aplikacích počítačového zpracování přirozeného jazyka, např. v internetovém vyhledávání. Smysluplnost vět je vlastnost, kterou nelze definovat univerzálně. Je třeba vymezit rovinu jazykového popisu, vzhledem ke které je smysluplnost určována. V našem řešení sledujeme systém rovin, který vychází od morfologické roviny přes syntaktickou až k sémantické. Bakalářská práce bude pokrývat první dvě roviny. Cílovým jazykem je čeština.
Preliminary scope of work in English
Syntactically meaningful sentence classification is a very interesting task for the applications of natural language processing, for ex. the web search engines. ´To-be-meaningful´ is a feature that cannot be defined in an absolute way. It is necessary to specify a layer of the natural language description on which the sentence classification will be done. In our approach, we pursue a layer system that goes from the morphological layer through the syntactical layer to the semantic layer - the bachelor thesis will cover the first two of three layers. Czech will be used as the object language.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html