Vizualizace podobnosti dokumentů
Thesis title in Czech: | Vizualizace podobnosti dokumentů |
---|---|
Thesis title in English: | Document similarity visualization |
Academic year of topic announcement: | 2006/2007 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Institute of Formal and Applied Linguistics (32-UFAL) |
Supervisor: | doc. RNDr. Pavel Pecina, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 09.11.2006 |
Date of assignment: | 09.11.2006 |
Date and time of defence: | 11.09.2007 00:00 |
Date of electronic submission: | 11.09.2007 |
Date of proceeded defence: | 11.09.2007 |
Opponents: | Mgr. Pavel Schlesinger |
Guidelines |
Úloha podobnosti dokumentů se velmi často řeší automaticky v rámci velkých kolekcí s přísnými požadavky na co nejmenší časovou a paměťovou náročnost použitých metod. Jiným případem je ovšem situace, kdy uživatel potřebuje porovnat jedinou dvojici dokumentů a získat relativně detailní přehled o jejich podobnosti (případně podobnosti jejich částí), aniž by je musel číst a detailně studovat. V takovém případě je ideální dokumenty a jejich podobnost vhodně vizualizovat.
Cílem bakalářské práce je implementovat aplikaci s grafickým rozhraním umožňujícím komfortní vizualní porovnávání dvojic dokumentů prostřednictvím různých náhledů, jako je např. dotplot nebo také diff. |
References |
Christopher D. Manning, Hinrich Schutze: Foundations of Statistical Natural Language Processing, The MIT Press, 1999
K.W. Church and J.I. Helfman. Dotplot: A Program for Exploring Self-Similarity in Millions of Lines for Text and Code. Journal of Computational and Graphical Statistics, 2(2):153--174, June 1993 |