Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Semantic information from FrameNet and the possibility of its transfer to Czech data
Název práce v češtině: Sémantická informace ze sítě FrameNet a možnosti jejího využití pro česká data
Název v anglickém jazyce: Semantic information from FrameNet and the possibility of its transfer to Czech data
Klíčová slova: FrameNet, sémantika rámců, strojové učení, word sense disambiguation, čeština
Klíčová slova anglicky: FrameNet, frame semantics, machine learning, word sense disambiguation, Czech
Akademický rok vypsání: 2015/2016
Typ práce: diplomová práce
Jazyk práce: angličtina
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Markéta Lopatková, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 22.02.2016
Datum zadání: 24.02.2016
Datum potvrzení stud. oddělením: 26.02.2016
Datum a čas obhajoby: 08.09.2016 09:00
Datum odevzdání elektronické podoby:27.07.2016
Datum odevzdání tištěné podoby:28.07.2016
Datum proběhlé obhajoby: 08.09.2016
Oponenti: RNDr. Martin Holub, Ph.D.
 
 
 
Zásady pro vypracování
Cílem práce je studovat možnosti využití sémantické informace ze sítě FrameNet napříč jazyky, konkrétně možnosti přenesení dostupné informace do českých jazykových zdrojů.
Diplomant navrhne a podrobně vyhodnotí automatický systém, který na základě dostupných dat (zejména anotace v rámci projektu FrameNet, paralelní korpus PCEDT, anotace českých sloves) pro vzorek českých vět určí základní sémantickou strukturu – určí sémantické rámce (SF) pro jednotlivé propozice a identifikuje jejich elementy (FE).
K práci je možno využít existující nástroje pro zpracování anglických i českých dat (např. nástroje pro automatickou morfologii, tagging, parsing).
Seznam odborné literatury
Ruppenhofer J., Ellsworth M., Petruck M.R.L., Johnson C.R., Scheffczyk J.. FrameNet II: Extended Theory and Practice. University of California, Berkeley, 2006. https://framenet.icsi.berkeley.edu/fndrupal/

Hajič , J. Hajičová E., Panevová J., Sgall ., Cinková S., Fučíková E., Mikulová M., Pajas P., Popelka J., Semecký J., Šindlerová J., Štěpánek J., Toman J., Urešová Z., Žabokrtský Z.. Prague Czech-English Dependency Treebank 2.0. Data/software, Institute of Formal and Applied Linguistics, Prague, Czech republic, 2011.
http://ufal.mff.cuni.cz/pcedt2.0/

Lopatková M., Žabokrtský Z., Kettnerová V.. Valenční slovník českých sloves. Karolinum, Praha, 382 pp., 2008.

Pado S.. Cross-Lingual Annotation Projection Models. PhD Thesis, Saarland University, 2007.
http://www.coli.uni-saarland.de/bib/files/diss_pado.pdf

Basili R., De Cao D., Croce D., Coppola B., Moschitti A.. Cross-Language Frame Semantics Transfer in Bilingual Corpora. In CICLing, 2009, pp. 332-345, 2009.
http://link.springer.com/chapter/10.1007%2F978-3-642-00382-0_27

Kettnerová V., Lopatková M., Bejček E.. Mapping Semantic Information from FrameNet onto VALLEX. In The Prague Bulletin of Mathematical Linguistics, Vol. 97, pp. 23-41, 2012.

dokumentace k použitým nástrojům
 
Univerzita Karlova | Informační systém UK