Automatické zpracování českých soudních rozhodnutí
Název práce v češtině: | Automatické zpracování českých soudních rozhodnutí |
---|---|
Název v anglickém jazyce: | Processing of Czech court decisions |
Klíčová slova: | počítačové zpracování přirozeného jazyka, extrakce informací, legislativní doména, strojové učení, pravidlové systémy |
Klíčová slova anglicky: | natural language processing, information extraction, legislative domain, machine learning, rule-based systems |
Akademický rok vypsání: | 2014/2015 |
Typ práce: | diplomová práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. Mgr. Barbora Vidová Hladká, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 26.04.2015 |
Datum zadání: | 27.04.2015 |
Datum potvrzení stud. oddělením: | 30.04.2015 |
Datum a čas obhajoby: | 15.06.2015 09:00 |
Datum odevzdání elektronické podoby: | 14.05.2015 |
Datum odevzdání tištěné podoby: | 07.05.2015 |
Datum proběhlé obhajoby: | 15.06.2015 |
Oponenti: | doc. Mgr. Martin Nečaský, Ph.D. |
Zásady pro vypracování |
Cílem diplomové práce je experimentálně prozkoumat možnosti automatického zpracování soudních rozhodnutí vydaných českými soudy. Zpracování je zaměřeno na dvě úlohy extrakce strukturovaných informací ze vstupních nestrukturovaných rozhodnutí, a sice (i) extrakce údajů o účastnících řízení a (ii) klasifikace soudních rozhodnutí dle právních oblastí a výsledků řízení. Pro každou úlohu budou experimentálně vyhodnoceny přístupy založené na strojovém učení a na pravidlech. Předpokládá se využití nástrojů pro zpracování textů vyvinutých v Ústavu formální a aplikované lingvistiky MFF UK. Hlavním výstupem práce bude systematický přehled provedených experimentů včetně jejich evaluace.
Dílčí cíle: 1, Rešerše české legislativní domény se zaměřením na soudní rozhodnutí 2, Výběr nástrojů z ÚFAL MFF UK 3, Specifikace úloh (i) a (ii) 4, Příprava trénovacích a testovacích dat 5, Experimenty a jejich evaluace 6, Implementace experimentálního nástroje pro zpracování soudních rozhodnutí (webová aplikace a spuštění z příkazové řádky) |
Seznam odborné literatury |
1. Aggarwal, Charu C., and ChengXiang Zhai. A survey of text classification algorithms." Mining text data (2012): 163-222.
2. Dozier, Christopher, et al. Named entity recognition and resolution in legal text. Springer Berlin Heidelberg, 2010. 3. Kríž Vincent, Hladká Barbora, Nečaský Martin, Dědek Jan: Statistical Recognition of References in Czech Court Decisions. In: 13th Mexican International Conference on Artificial Intelligence, MICAI 2014, Tuxtla Gutiérrez, Mexico, November 16-22, 2014. Proceedings, Part I, Copyright © Springer International Publishing, Switzerland, ISBN 978-3-319-13646-2, pp. 51-61, 2014 4. Quaresma, Paulo, and Teresa Gonçalves. "Using linguistic information and machine learning techniques to identify entities from juridical documents."Semantic Processing of Legal Texts (2010): 44-59. 5. Straková Jana, Straka Milan and Hajič Jan. Open-Source Tools for Morphology, Lemmatization, POS Tagging and Named Entity Recognition. In Proceedings of 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations, pages 13-18, Baltimore, Maryland, June 2014. Association for Computational Linguistics. |