Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Automatické přiřazení diagnoz lékařským zprávám

Název práce v jazyce práce (slovenština):	Automatické přiřazení diagnoz lékařským zprávám
Název práce v češtině:	Automatické přiřazení diagnoz lékařským zprávám
Název v anglickém jazyce:	Automatic assignment of diagnosis to medical reports
Klíčová slova:	strojové učenie, kategorizácia textu, ICD-10
Klíčová slova anglicky:	machine learning, text classification, ICD-10
Akademický rok vypsání:	2013/2014
Typ práce:	bakalářská práce
Jazyk práce:	slovenština
Ústav:	Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel:	RNDr. Jiří Hana, Ph.D.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	21.11.2013
Datum zadání:	21.11.2013
Datum potvrzení stud. oddělením:	20.12.2013
Datum a čas obhajoby:	16.06.2014 00:00
Datum odevzdání elektronické podoby:	23.05.2014
Datum odevzdání tištěné podoby:	23.05.2014
Datum proběhlé obhajoby:	16.06.2014
Oponenti:	doc. Mgr. Barbora Vidová Hladká, Ph.D.

Zásady pro vypracování

Cílem práce je vytvořit program, který lékařským zprávám přiřadí diagnozu, resp. diagnozy (ICD-10) pomocí metod strojového učení na základě trénovacích dat. Hlavním problémem bude najít množinu charakteristik textu, jako například výskyt určitých slov či frází, umožňující klasifikačnímu (nebo rankovacímu) algoritmu přiřadit správnou diagnozu. Součástí práce bude i předzpracování textu, například oprava překlepů, rozvinutí zkratek, lemmatizace, atd.

Seznam odborné literatury

- Manning & Schutze (1999): Foundations of Statistical Natural Language Processing
- Pestian et al (2007): A shared task involving multi-label classification of clinical free text

Předběžná náplň práce v anglickém jazyce

The goal of the thesis is to create an application assigning diagnosis codes (ICD-10) to free-text medical reports. It should be implemented in the machine learning paradigm: using labeled training data, the program would learn to assign/rank possible diagnoses to a report on the basis of features of the text (e.g. presence of particular words or phrases). The reports will need preprocessing, e.g. spelling correction, abbreviation expansion, lemmatization, etc.