Thesis (Selection of subject)Thesis (Selection of subject)(version: 390)
Thesis details
   Login via CAS
Vyhodnocování podobnosti českých textů
Thesis title in Czech: Vyhodnocování podobnosti českých textů
Thesis title in English: The resemblance analysis of Czech texts
Academic year of topic announcement: 2006/2007
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Department of Software and Computer Science Education (32-KSVI)
Supervisor: RNDr. Tomáš Holan, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 06.11.2006
Date of assignment: 06.11.2006
Date and time of defence: 25.06.2007 00:00
Date of electronic submission:31.05.2007
Date of submission of printed version:31.05.2007
Date of proceeded defence: 25.06.2007
Opponents: doc. RNDr. Vladislav Kuboň, Ph.D.
 
 
 
Guidelines
Cílem je vytvořit program, který bude porovnávat dva české texty. Výsledkem bude číslo udávající míru podobnosti daných textů. Tato míra bude spočítána skládáním dílčích srovnávacích kritérií počítajících podobnost různými způsoby. V programu bude zabudováno několik porovnávacích kritérií, další bude možno snadno přidat.

Program bude pracovat ve dvou režimech:
Učení.
Uživatel předloží programu několik českých textů a požadované výsledky porovnávání některých dvojic textů. Program nastaví významnost jednotlivých porovnávacích kritérií.

Porovnávání.
Uživatel zadá programu dva texty, program vyhodnotí jejich podobnost pomocí srovnávacích kritérií. Celková míra podobnosti bude spočítána skládáním dílčích měr s přihlédnutím k jejich významnosti nastavené při učení.
References
Jaroslav Pokorný, Václav Snášel, Dušan Húsek, nakladatelství UK: Dokumentografické informační systémy
Materiály k přednášce Neuronové sítě [AIL002] http://ksvi.mff.cuni.cz/~mraz/nn/slides/
Peter Drayton, Ben Albahari, Ted Newand, nakladatelství O’Reilly: C# v kostce
Dokumentace k jazyku C# a platformě .NET
a další dle vlastního uvážení
Preliminary scope of work
Program vyhodnocující podobnost dvou českých textů na základě rozličných kritérií, schopný se učit.
Preliminary scope of work in English
The program evaluating the resemblance of two Czech texts using various criteria, able to learn.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html