Vyhodnocování podobnosti českých textů
Název práce v češtině: | Vyhodnocování podobnosti českých textů |
---|---|
Název v anglickém jazyce: | The resemblance analysis of Czech texts |
Akademický rok vypsání: | 2006/2007 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Katedra softwaru a výuky informatiky (32-KSVI) |
Vedoucí / školitel: | RNDr. Tomáš Holan, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 06.11.2006 |
Datum zadání: | 06.11.2006 |
Datum a čas obhajoby: | 25.06.2007 00:00 |
Datum odevzdání elektronické podoby: | 31.05.2007 |
Datum odevzdání tištěné podoby: | 31.05.2007 |
Datum proběhlé obhajoby: | 25.06.2007 |
Oponenti: | doc. RNDr. Vladislav Kuboň, Ph.D. |
Zásady pro vypracování |
Cílem je vytvořit program, který bude porovnávat dva české texty. Výsledkem bude číslo udávající míru podobnosti daných textů. Tato míra bude spočítána skládáním dílčích srovnávacích kritérií počítajících podobnost různými způsoby. V programu bude zabudováno několik porovnávacích kritérií, další bude možno snadno přidat.
Program bude pracovat ve dvou režimech: Učení. Uživatel předloží programu několik českých textů a požadované výsledky porovnávání některých dvojic textů. Program nastaví významnost jednotlivých porovnávacích kritérií. Porovnávání. Uživatel zadá programu dva texty, program vyhodnotí jejich podobnost pomocí srovnávacích kritérií. Celková míra podobnosti bude spočítána skládáním dílčích měr s přihlédnutím k jejich významnosti nastavené při učení. |
Seznam odborné literatury |
Jaroslav Pokorný, Václav Snášel, Dušan Húsek, nakladatelství UK: Dokumentografické informační systémy
Materiály k přednášce Neuronové sítě [AIL002] http://ksvi.mff.cuni.cz/~mraz/nn/slides/ Peter Drayton, Ben Albahari, Ted Newand, nakladatelství O’Reilly: C# v kostce Dokumentace k jazyku C# a platformě .NET a další dle vlastního uvážení |
Předběžná náplň práce |
Program vyhodnocující podobnost dvou českých textů na základě rozličných kritérií, schopný se učit. |
Předběžná náplň práce v anglickém jazyce |
The program evaluating the resemblance of two Czech texts using various criteria, able to learn. |