Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Vyhledávání vztahů a událostí v policejních záznamech
Thesis title in Czech: Vyhledávání vztahů a událostí v policejních záznamech
Thesis title in English: Finding Relations and Events in Police Records
Academic year of topic announcement: 2012/2013
Thesis type: school year task
Thesis language:
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. RNDr. Ondřej Bojar, Ph.D.
Author:
Guidelines
Policie ČR disponuje rozsáhlým souborem policejních zpráv. Zprávy mají formát volného textu a ručně je k části těchto dat připojena formální anotace zachycující osoby, vozidla, zbraně, drogy a další důležité entity, vztahy mezi nimi (p. Novák vlastní vůz s danou poznávací značkou) i události, k nimž došlo (někdo se setkal s někým). Formalizované zápisy jsou přirozeně mnohem lépe analyzovatelné.

Cílem ročníkového projektu, následné bakalářské a navazující diplomové práce je tento formální zápis z kriminálních zpráv vyrábět automaticky.

V rámci ročníkového projektu a bakalářské práce bude třeba nejprve (strojově) namapovat objekty z existující anotace zpět na konkrétní jazykové výrazy, na základě nichž anotátor objekt v textu identifikoval. Ve druhé fázi, pravděpodobně již v rámci diplomové práce, je pak úkolem navrhnout, implementovat a vyhodnotit metodu, která známé typy vazeb a událostí bude hledat v nových textech.

Práce by se v maximální možné míře měla opřít o existující nástroje pro zpracování češtiny, např. morfologickou a syntaktickou analýzu či rozpoznávání pojmenovaných entit.

Práce bude testována na skutečných, anonymizovaných, textech.
References
Bude doplněn později.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html