Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 290)
Detail práce
   Přihlásit přes CAS
Automatické přiřazení diagnoz lékařským zprávám
Název práce v jazyce práce (slovenština): Automatické přiřazení diagnoz lékařským zprávám
Název práce v češtině: Automatické přiřazení diagnoz lékařským zprávám
Název v anglickém jazyce: Automatic assignment of diagnosis to medical reports
Klíčová slova: strojové učenie, kategorizácia textu, ICD-10
Klíčová slova anglicky: machine learning, text classification, ICD-10
Akademický rok vypsání: 2013/2014
Typ práce: bakalářská práce
Jazyk práce: slovenština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: RNDr. Jiří Hana, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 21.11.2013
Datum zadání: 21.11.2013
Datum potvrzení stud. oddělením: 20.12.2013
Datum a čas obhajoby: 16.06.2014 00:00
Datum odevzdání elektronické podoby:23.05.2014
Datum odevzdání tištěné podoby:23.05.2014
Datum proběhlé obhajoby: 16.06.2014
Oponenti: Mgr. Barbora Vidová Hladká, Ph.D.
 
 
 
Zásady pro vypracování
Cílem práce je vytvořit program, který lékařským zprávám přiřadí diagnozu, resp. diagnozy (ICD-10) pomocí metod strojového učení na základě trénovacích dat. Hlavním problémem bude najít množinu charakteristik textu, jako například výskyt určitých slov či frází, umožňující klasifikačnímu (nebo rankovacímu) algoritmu přiřadit správnou diagnozu. Součástí práce bude i předzpracování textu, například oprava překlepů, rozvinutí zkratek, lemmatizace, atd.
Seznam odborné literatury
- Manning & Schutze (1999): Foundations of Statistical Natural Language Processing
- Pestian et al (2007): A shared task involving multi-label classification of clinical free text
Předběžná náplň práce v anglickém jazyce
The goal of the thesis is to create an application assigning diagnosis codes (ICD-10) to free-text medical reports. It should be implemented in the machine learning paradigm: using labeled training data, the program would learn to assign/rank possible diagnoses to a report on the basis of features of the text (e.g. presence of particular words or phrases). The reports will need preprocessing, e.g. spelling correction, abbreviation expansion, lemmatization, etc.
 
Univerzita Karlova | Informační systém UK