Thesis (Selection of subject)

Your browser does not support JavaScript, or its support is disabled. Some features may not be available.

Automatické zpracování českých soudních rozhodnutí

Thesis title in Czech:	Automatické zpracování českých soudních rozhodnutí
Thesis title in English:	Processing of Czech court decisions
Key words:	počítačové zpracování přirozeného jazyka, extrakce informací, legislativní doména, strojové učení, pravidlové systémy
English key words:	natural language processing, information extraction, legislative domain, machine learning, rule-based systems
Academic year of topic announcement:	2014/2015
Thesis type:	diploma thesis
Thesis language:	čeština
Department:	Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor:	doc. Mgr. Barbora Vidová Hladká, Ph.D.
Author:	hidden - assigned and confirmed by the Study Dept.
Date of registration:	26.04.2015
Date of assignment:	27.04.2015
Confirmed by Study dept. on:	30.04.2015
Date and time of defence:	15.06.2015 09:00
Date of electronic submission:	14.05.2015
Date of submission of printed version:	07.05.2015
Date of proceeded defence:	15.06.2015
Opponents:	doc. Mgr. Martin Nečaský, Ph.D.

Guidelines

Cílem diplomové práce je experimentálně prozkoumat možnosti automatického zpracování soudních rozhodnutí vydaných českými soudy. Zpracování je zaměřeno na dvě úlohy extrakce strukturovaných informací ze vstupních nestrukturovaných rozhodnutí, a sice (i) extrakce údajů o účastnících řízení a (ii) klasifikace soudních rozhodnutí dle právních oblastí a výsledků řízení. Pro každou úlohu budou experimentálně vyhodnoceny přístupy založené na strojovém učení a na pravidlech. Předpokládá se využití nástrojů pro zpracování textů vyvinutých v Ústavu formální a aplikované lingvistiky MFF UK. Hlavním výstupem práce bude systematický přehled provedených experimentů včetně jejich evaluace.

Dílčí cíle:

1, Rešerše české legislativní domény se zaměřením na soudní rozhodnutí
2, Výběr nástrojů z ÚFAL MFF UK
3, Specifikace úloh (i) a (ii)
4, Příprava trénovacích a testovacích dat
5, Experimenty a jejich evaluace
6, Implementace experimentálního nástroje pro zpracování soudních rozhodnutí (webová aplikace a spuštění z příkazové řádky)

References

1. Aggarwal, Charu C., and ChengXiang Zhai. A survey of text classification algorithms." Mining text data (2012): 163-222.

2. Dozier, Christopher, et al. Named entity recognition and resolution in legal text. Springer Berlin Heidelberg, 2010.

3. Kríž Vincent, Hladká Barbora, Nečaský Martin, Dědek Jan: Statistical Recognition of References in Czech Court Decisions. In: 13th Mexican International Conference on Artificial Intelligence, MICAI 2014, Tuxtla Gutiérrez, Mexico, November 16-22, 2014. Proceedings, Part I, Copyright © Springer International Publishing, Switzerland, ISBN 978-3-319-13646-2, pp. 51-61, 2014

4. Quaresma, Paulo, and Teresa Gonçalves. "Using linguistic information and machine learning techniques to identify entities from juridical documents."Semantic Processing of Legal Texts (2010): 44-59.

5. Straková Jana, Straka Milan and Hajič Jan. Open-Source Tools for Morphology, Lemmatization, POS Tagging and Named Entity Recognition. In Proceedings of 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations, pages 13-18, Baltimore, Maryland, June 2014. Association for Computational Linguistics.