Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Typické vzory užívání anglických sloves
Thesis title in Czech: Typické vzory užívání anglických sloves
Thesis title in English: Typical Usage Patterns of English Verbs
Academic year of topic announcement: 2009/2010
Thesis type: diploma thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: RNDr. Martin Holub, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 16.11.2009
Date of assignment: 16.11.2009
Date and time of defence: 06.09.2010 00:00
Date of electronic submission:06.09.2010
Date of proceeded defence: 06.09.2010
Opponents: doc. RNDr. Markéta Lopatková, Ph.D.
 
 
 
Guidelines
Metoda CPA (z angl. Corpus Pattern Analysis) je důsledně korpusová, empirická metoda, která analyzuje typické vzory užívání slov v jazykovém korpusu a popisuje význam sloves pomocí kontextových preferencí definovaných jak syntakticky, tak sémanticky [3]. V současné době pomocí CPA a s využitím Britského národního korpusu (BNC) vzniká Slovník vzorů užívání anglických sloves (PDEV, z angl. Pattern Dictionary of English Verbs) [1, 3]. V rámci tohoto projektu bylo již zkompilováno téměř 600 anglických sloves, která pokrývají cca 10% slovesných výskytů v BNC. Vedle slovníkových hesel obsahujících definici typických vzorů užívání sloves jsou též veřejně dostupná rozsáhlá korpusová data se slovesy označkovanými podle PDEV [3]. Nedílnou součástí CPA je empiricky vybudovaný systém sémantických typů [2, 3]. Kombinací sémantických typů a syntaxe metoda CPA originálním způsobem konkuruje tradičním přístupům k automatickému rozpoznávání významu sloves [4].

Cílem diplomové práce je analyzovat a co nejlépe využít dostupná data o typických vzorech užívání anglických sloves. Diplomová práce má zkoumat, jak lze využít PDEV pro automatickou analýzu lexikálního významu a má vést k návrhu procedur, které automatického rozpoznávání podpoří nebo pomohou zefektivnit další vývoj slovníku PDEV (včetně rozšiřování množiny anotovaných dat). Práce též musí obsahovat experimentální ověření účinnosti navržených procedur (tj. jejich empirickou evaluaci). Mimo jiné se předpokládá podrobná analýza dostupných dat včetně statistického vyhodnocení míry mezianotátorské shody při anotování typických vzorů užití a extrakce lexikálních jednotek realizujících jednotlivé sémantické typy v BNC s využitím automatického parsingu angličtiny.



References
[1] Hanks, Patrick, and James Pustejovsky: A Pattern Dictionary for Natural Language Processing. In Revue Francaise de linguistique appliquée, 10:2, 2005.

[2] Hanks Patrick, Karel Pala and Pavel Rychly: Towards an empirically well-founded ontology for NLP. In Proceedings of the 4th International Workshop on Generative Approaches to the Lexicon, Paris, 2007.

[3] Webové stránky mezinárodního projektu CPA. http://nlp.fi.muni.cz/projekty/cpa/.

[4] Agirre, E. and Edmonds, P. (eds.): Word Sense Disambiguation: Algorithms and Applications. Springer, 2007. (vybrané kapitoly)

[5] Daniel Jurafsky and James H. Martin: SPEECH and LANGUAGE PROCESSING. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall, 2009. (vybrané kapitoly)
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html