Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Vyhledávání vztahů a událostí v policejních záznamech
Název práce v češtině: Vyhledávání vztahů a událostí v policejních záznamech
Název v anglickém jazyce: Finding Relations and Events in Police Records
Akademický rok vypsání: 2012/2013
Typ práce: ročníková práce
Jazyk práce:
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Ondřej Bojar, Ph.D.
Řešitel:
Zásady pro vypracování
Policie ČR disponuje rozsáhlým souborem policejních zpráv. Zprávy mají formát volného textu a ručně je k části těchto dat připojena formální anotace zachycující osoby, vozidla, zbraně, drogy a další důležité entity, vztahy mezi nimi (p. Novák vlastní vůz s danou poznávací značkou) i události, k nimž došlo (někdo se setkal s někým). Formalizované zápisy jsou přirozeně mnohem lépe analyzovatelné.

Cílem ročníkového projektu, následné bakalářské a navazující diplomové práce je tento formální zápis z kriminálních zpráv vyrábět automaticky.

V rámci ročníkového projektu a bakalářské práce bude třeba nejprve (strojově) namapovat objekty z existující anotace zpět na konkrétní jazykové výrazy, na základě nichž anotátor objekt v textu identifikoval. Ve druhé fázi, pravděpodobně již v rámci diplomové práce, je pak úkolem navrhnout, implementovat a vyhodnotit metodu, která známé typy vazeb a událostí bude hledat v nových textech.

Práce by se v maximální možné míře měla opřít o existující nástroje pro zpracování češtiny, např. morfologickou a syntaktickou analýzu či rozpoznávání pojmenovaných entit.

Práce bude testována na skutečných, anonymizovaných, textech.
Seznam odborné literatury
Bude doplněn později.
 
Univerzita Karlova | Informační systém UK