Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Automatické zpracování českých soudních rozhodnutí

Název práce v češtině:	Automatické zpracování českých soudních rozhodnutí
Název v anglickém jazyce:	Processing of Czech court decisions
Klíčová slova:	počítačové zpracování přirozeného jazyka, extrakce informací, legislativní doména, strojové učení, pravidlové systémy
Klíčová slova anglicky:	natural language processing, information extraction, legislative domain, machine learning, rule-based systems
Akademický rok vypsání:	2014/2015
Typ práce:	diplomová práce
Jazyk práce:	čeština
Ústav:	Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel:	doc. Mgr. Barbora Vidová Hladká, Ph.D.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	26.04.2015
Datum zadání:	27.04.2015
Datum potvrzení stud. oddělením:	30.04.2015
Datum a čas obhajoby:	15.06.2015 09:00
Datum odevzdání elektronické podoby:	14.05.2015
Datum odevzdání tištěné podoby:	07.05.2015
Datum proběhlé obhajoby:	15.06.2015
Oponenti:	doc. Mgr. Martin Nečaský, Ph.D.

Zásady pro vypracování

Cílem diplomové práce je experimentálně prozkoumat možnosti automatického zpracování soudních rozhodnutí vydaných českými soudy. Zpracování je zaměřeno na dvě úlohy extrakce strukturovaných informací ze vstupních nestrukturovaných rozhodnutí, a sice (i) extrakce údajů o účastnících řízení a (ii) klasifikace soudních rozhodnutí dle právních oblastí a výsledků řízení. Pro každou úlohu budou experimentálně vyhodnoceny přístupy založené na strojovém učení a na pravidlech. Předpokládá se využití nástrojů pro zpracování textů vyvinutých v Ústavu formální a aplikované lingvistiky MFF UK. Hlavním výstupem práce bude systematický přehled provedených experimentů včetně jejich evaluace.

Dílčí cíle:

1, Rešerše české legislativní domény se zaměřením na soudní rozhodnutí
2, Výběr nástrojů z ÚFAL MFF UK
3, Specifikace úloh (i) a (ii)
4, Příprava trénovacích a testovacích dat
5, Experimenty a jejich evaluace
6, Implementace experimentálního nástroje pro zpracování soudních rozhodnutí (webová aplikace a spuštění z příkazové řádky)

Seznam odborné literatury

1. Aggarwal, Charu C., and ChengXiang Zhai. A survey of text classification algorithms." Mining text data (2012): 163-222.

2. Dozier, Christopher, et al. Named entity recognition and resolution in legal text. Springer Berlin Heidelberg, 2010.

3. Kríž Vincent, Hladká Barbora, Nečaský Martin, Dědek Jan: Statistical Recognition of References in Czech Court Decisions. In: 13th Mexican International Conference on Artificial Intelligence, MICAI 2014, Tuxtla Gutiérrez, Mexico, November 16-22, 2014. Proceedings, Part I, Copyright © Springer International Publishing, Switzerland, ISBN 978-3-319-13646-2, pp. 51-61, 2014

4. Quaresma, Paulo, and Teresa Gonçalves. "Using linguistic information and machine learning techniques to identify entities from juridical documents."Semantic Processing of Legal Texts (2010): 44-59.

5. Straková Jana, Straka Milan and Hajič Jan. Open-Source Tools for Morphology, Lemmatization, POS Tagging and Named Entity Recognition. In Proceedings of 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations, pages 13-18, Baltimore, Maryland, June 2014. Association for Computational Linguistics.