Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Vizualizace podobnosti dokumentů
Thesis title in Czech: Vizualizace podobnosti dokumentů
Thesis title in English: Document similarity visualization
Academic year of topic announcement: 2006/2007
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Institute of Formal and Applied Linguistics (32-UFAL)
Supervisor: doc. RNDr. Pavel Pecina, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 09.11.2006
Date of assignment: 09.11.2006
Date and time of defence: 11.09.2007 00:00
Date of electronic submission:11.09.2007
Date of proceeded defence: 11.09.2007
Opponents: Mgr. Pavel Schlesinger
 
 
 
Guidelines
Úloha podobnosti dokumentů se velmi často řeší automaticky v rámci velkých kolekcí s přísnými požadavky na co nejmenší časovou a paměťovou náročnost použitých metod. Jiným případem je ovšem situace, kdy uživatel potřebuje porovnat jedinou dvojici dokumentů a získat relativně detailní přehled o jejich podobnosti (případně podobnosti jejich částí), aniž by je musel číst a detailně studovat. V takovém případě je ideální dokumenty a jejich podobnost vhodně vizualizovat.
Cílem bakalářské práce je implementovat aplikaci s grafickým rozhraním umožňujícím komfortní vizualní porovnávání dvojic dokumentů prostřednictvím různých náhledů, jako je např. dotplot nebo také diff.
References
Christopher D. Manning, Hinrich Schutze: Foundations of Statistical Natural Language Processing, The MIT Press, 1999

K.W. Church and J.I. Helfman. Dotplot: A Program for Exploring Self-Similarity in Millions of Lines for Text and Code. Journal of Computational and Graphical Statistics, 2(2):153--174, June 1993
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html