Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 392)
Detail práce
   Přihlásit přes CAS
Dynamická detekce plagiátů
Název práce v češtině: Dynamická detekce plagiátů
Název v anglickém jazyce: Detection of Plagiarism
Akademický rok vypsání: 2007/2008
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra softwarového inženýrství (32-KSI)
Vedoucí / školitel: RNDr. Leo Galamboš, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 14.11.2007
Datum zadání: 14.11.2007
Datum a čas obhajoby: 02.02.2009 00:00
Datum odevzdání elektronické podoby:02.02.2009
Datum proběhlé obhajoby: 02.02.2009
Oponenti: RNDr. Matúš Ondreička, Ph.D.
 
 
 
Zásady pro vypracování
- prostudujte strukturu projektu egothor2
- porovnejte způsoby řešení odstraňování duplicit
- navrněte metody detekce plagiátů pro dynamicky se měnící báze dokumentů
- rozšiřte na úroveň odstavců
- implementujte
Seznam odborné literatury
Leo Galambos: Egothor2, http://www.egothor.org/docs/e2.pdf
Jakub Podhorny: Transakce ve fulltextovém vyhledávacím stroji, diplomova prace MFF UK 2007.
Soumen Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data. Amsterdam: Morgan Kaufmann, 2003.
Ricardo Baeza-Yates, Berthier Ribeiro-Neto: Modern Information Retrieval. Addison Wesley, 1999.
Ian H. Witten, Alistair Moffat, and Timothy C. Bell: Managing Gigabytes: Compressing and Indexing Documents and Images. Van Nostrand Reinhold, 1994.
Předběžná náplň práce
Detekce plagiátů je v současnosti závažný problém a jeho odhalování vyžaduje poměrně veliký výpočetní výkon. Podobný problém řešily i vyhledávače při redukci duplicit. Práce se proto zabývá rozšířením postupů z webového vyhledávání na dynamicky se měnící báze (vědeckých) textů za účelem efektivního odhalování plagiátů.
Předběžná náplň práce v anglickém jazyce
Plagiarism detection has become a serious issue and the process consumes a lot of CPU power. A similar issue was recognized by the Web search engines, because they also try to eliminate duplicities in their indices.

This work studies the classic algorithms developed for the Web search, and adapts them to the world of a dynamic document base of (scientific) articles. The effective implementation is also provided on top of the egothor2 platform.
 
Univerzita Karlova | Informační systém UK