Vyhledávání vztahů a událostí v policejních záznamech
Thesis title in Czech: | Vyhledávání vztahů a událostí v policejních záznamech |
---|---|
Thesis title in English: | Finding Relations and Events in Police Records |
Academic year of topic announcement: | 2012/2013 |
Thesis type: | school year task |
Thesis language: | |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. RNDr. Ondřej Bojar, Ph.D. |
Author: |
Guidelines |
Policie ČR disponuje rozsáhlým souborem policejních zpráv. Zprávy mají formát volného textu a ručně je k části těchto dat připojena formální anotace zachycující osoby, vozidla, zbraně, drogy a další důležité entity, vztahy mezi nimi (p. Novák vlastní vůz s danou poznávací značkou) i události, k nimž došlo (někdo se setkal s někým). Formalizované zápisy jsou přirozeně mnohem lépe analyzovatelné.
Cílem ročníkového projektu, následné bakalářské a navazující diplomové práce je tento formální zápis z kriminálních zpráv vyrábět automaticky. V rámci ročníkového projektu a bakalářské práce bude třeba nejprve (strojově) namapovat objekty z existující anotace zpět na konkrétní jazykové výrazy, na základě nichž anotátor objekt v textu identifikoval. Ve druhé fázi, pravděpodobně již v rámci diplomové práce, je pak úkolem navrhnout, implementovat a vyhodnotit metodu, která známé typy vazeb a událostí bude hledat v nových textech. Práce by se v maximální možné míře měla opřít o existující nástroje pro zpracování češtiny, např. morfologickou a syntaktickou analýzu či rozpoznávání pojmenovaných entit. Práce bude testována na skutečných, anonymizovaných, textech. |
References |
Bude doplněn později. |