Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Vizualizace podobnosti dokumentů
Název práce v češtině: Vizualizace podobnosti dokumentů
Název v anglickém jazyce: Document similarity visualization
Akademický rok vypsání: 2006/2007
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Pavel Pecina, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 09.11.2006
Datum zadání: 09.11.2006
Datum a čas obhajoby: 11.09.2007 00:00
Datum odevzdání elektronické podoby:11.09.2007
Datum proběhlé obhajoby: 11.09.2007
Oponenti: Mgr. Pavel Schlesinger
 
 
 
Zásady pro vypracování
Úloha podobnosti dokumentů se velmi často řeší automaticky v rámci velkých kolekcí s přísnými požadavky na co nejmenší časovou a paměťovou náročnost použitých metod. Jiným případem je ovšem situace, kdy uživatel potřebuje porovnat jedinou dvojici dokumentů a získat relativně detailní přehled o jejich podobnosti (případně podobnosti jejich částí), aniž by je musel číst a detailně studovat. V takovém případě je ideální dokumenty a jejich podobnost vhodně vizualizovat.
Cílem bakalářské práce je implementovat aplikaci s grafickým rozhraním umožňujícím komfortní vizualní porovnávání dvojic dokumentů prostřednictvím různých náhledů, jako je např. dotplot nebo také diff.
Seznam odborné literatury
Christopher D. Manning, Hinrich Schutze: Foundations of Statistical Natural Language Processing, The MIT Press, 1999

K.W. Church and J.I. Helfman. Dotplot: A Program for Exploring Self-Similarity in Millions of Lines for Text and Code. Journal of Computational and Graphical Statistics, 2(2):153--174, June 1993
 
Univerzita Karlova | Informační systém UK