Semantic information from FrameNet and the possibility of its transfer to Czech data
Název práce v češtině: | Sémantická informace ze sítě FrameNet a možnosti jejího využití pro česká data |
---|---|
Název v anglickém jazyce: | Semantic information from FrameNet and the possibility of its transfer to Czech data |
Klíčová slova: | FrameNet, sémantika rámců, strojové učení, word sense disambiguation, čeština |
Klíčová slova anglicky: | FrameNet, frame semantics, machine learning, word sense disambiguation, Czech |
Akademický rok vypsání: | 2015/2016 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Markéta Lopatková, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 22.02.2016 |
Datum zadání: | 24.02.2016 |
Datum potvrzení stud. oddělením: | 26.02.2016 |
Datum a čas obhajoby: | 08.09.2016 09:00 |
Datum odevzdání elektronické podoby: | 27.07.2016 |
Datum odevzdání tištěné podoby: | 28.07.2016 |
Datum proběhlé obhajoby: | 08.09.2016 |
Oponenti: | RNDr. Martin Holub, Ph.D. |
Zásady pro vypracování |
Cílem práce je studovat možnosti využití sémantické informace ze sítě FrameNet napříč jazyky, konkrétně možnosti přenesení dostupné informace do českých jazykových zdrojů.
Diplomant navrhne a podrobně vyhodnotí automatický systém, který na základě dostupných dat (zejména anotace v rámci projektu FrameNet, paralelní korpus PCEDT, anotace českých sloves) pro vzorek českých vět určí základní sémantickou strukturu – určí sémantické rámce (SF) pro jednotlivé propozice a identifikuje jejich elementy (FE). K práci je možno využít existující nástroje pro zpracování anglických i českých dat (např. nástroje pro automatickou morfologii, tagging, parsing). |
Seznam odborné literatury |
Ruppenhofer J., Ellsworth M., Petruck M.R.L., Johnson C.R., Scheffczyk J.. FrameNet II: Extended Theory and Practice. University of California, Berkeley, 2006. https://framenet.icsi.berkeley.edu/fndrupal/
Hajič , J. Hajičová E., Panevová J., Sgall ., Cinková S., Fučíková E., Mikulová M., Pajas P., Popelka J., Semecký J., Šindlerová J., Štěpánek J., Toman J., Urešová Z., Žabokrtský Z.. Prague Czech-English Dependency Treebank 2.0. Data/software, Institute of Formal and Applied Linguistics, Prague, Czech republic, 2011. http://ufal.mff.cuni.cz/pcedt2.0/ Lopatková M., Žabokrtský Z., Kettnerová V.. Valenční slovník českých sloves. Karolinum, Praha, 382 pp., 2008. Pado S.. Cross-Lingual Annotation Projection Models. PhD Thesis, Saarland University, 2007. http://www.coli.uni-saarland.de/bib/files/diss_pado.pdf Basili R., De Cao D., Croce D., Coppola B., Moschitti A.. Cross-Language Frame Semantics Transfer in Bilingual Corpora. In CICLing, 2009, pp. 332-345, 2009. http://link.springer.com/chapter/10.1007%2F978-3-642-00382-0_27 Kettnerová V., Lopatková M., Bejček E.. Mapping Semantic Information from FrameNet onto VALLEX. In The Prague Bulletin of Mathematical Linguistics, Vol. 97, pp. 23-41, 2012. dokumentace k použitým nástrojům |