Vizualizace podobnosti dokumentů
Název práce v češtině: | Vizualizace podobnosti dokumentů |
---|---|
Název v anglickém jazyce: | Document similarity visualization |
Akademický rok vypsání: | 2006/2007 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Pavel Pecina, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 09.11.2006 |
Datum zadání: | 09.11.2006 |
Datum a čas obhajoby: | 11.09.2007 00:00 |
Datum odevzdání elektronické podoby: | 11.09.2007 |
Datum proběhlé obhajoby: | 11.09.2007 |
Oponenti: | Mgr. Pavel Schlesinger |
Zásady pro vypracování |
Úloha podobnosti dokumentů se velmi často řeší automaticky v rámci velkých kolekcí s přísnými požadavky na co nejmenší časovou a paměťovou náročnost použitých metod. Jiným případem je ovšem situace, kdy uživatel potřebuje porovnat jedinou dvojici dokumentů a získat relativně detailní přehled o jejich podobnosti (případně podobnosti jejich částí), aniž by je musel číst a detailně studovat. V takovém případě je ideální dokumenty a jejich podobnost vhodně vizualizovat.
Cílem bakalářské práce je implementovat aplikaci s grafickým rozhraním umožňujícím komfortní vizualní porovnávání dvojic dokumentů prostřednictvím různých náhledů, jako je např. dotplot nebo také diff. |
Seznam odborné literatury |
Christopher D. Manning, Hinrich Schutze: Foundations of Statistical Natural Language Processing, The MIT Press, 1999
K.W. Church and J.I. Helfman. Dotplot: A Program for Exploring Self-Similarity in Millions of Lines for Text and Code. Journal of Computational and Graphical Statistics, 2(2):153--174, June 1993 |