Vyhodnocování podobnosti českých textů
Thesis title in Czech: | Vyhodnocování podobnosti českých textů |
---|---|
Thesis title in English: | The resemblance analysis of Czech texts |
Academic year of topic announcement: | 2006/2007 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Department of Software and Computer Science Education (32-KSVI) |
Supervisor: | RNDr. Tomáš Holan, Ph.D. |
Author: | hidden![]() |
Date of registration: | 06.11.2006 |
Date of assignment: | 06.11.2006 |
Date and time of defence: | 25.06.2007 00:00 |
Date of electronic submission: | 31.05.2007 |
Date of submission of printed version: | 31.05.2007 |
Date of proceeded defence: | 25.06.2007 |
Opponents: | doc. RNDr. Vladislav Kuboň, Ph.D. |
Guidelines |
Cílem je vytvořit program, který bude porovnávat dva české texty. Výsledkem bude číslo udávající míru podobnosti daných textů. Tato míra bude spočítána skládáním dílčích srovnávacích kritérií počítajících podobnost různými způsoby. V programu bude zabudováno několik porovnávacích kritérií, další bude možno snadno přidat.
Program bude pracovat ve dvou režimech: Učení. Uživatel předloží programu několik českých textů a požadované výsledky porovnávání některých dvojic textů. Program nastaví významnost jednotlivých porovnávacích kritérií. Porovnávání. Uživatel zadá programu dva texty, program vyhodnotí jejich podobnost pomocí srovnávacích kritérií. Celková míra podobnosti bude spočítána skládáním dílčích měr s přihlédnutím k jejich významnosti nastavené při učení. |
References |
Jaroslav Pokorný, Václav Snášel, Dušan Húsek, nakladatelství UK: Dokumentografické informační systémy
Materiály k přednášce Neuronové sítě [AIL002] http://ksvi.mff.cuni.cz/~mraz/nn/slides/ Peter Drayton, Ben Albahari, Ted Newand, nakladatelství O’Reilly: C# v kostce Dokumentace k jazyku C# a platformě .NET a další dle vlastního uvážení |
Preliminary scope of work |
Program vyhodnocující podobnost dvou českých textů na základě rozličných kritérií, schopný se učit. |
Preliminary scope of work in English |
The program evaluating the resemblance of two Czech texts using various criteria, able to learn. |