Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Detekce plagiátů v odborných textech
Thesis title in Czech: Detekce plagiátů v odborných textech
Thesis title in English: Plagiarism Detection in Research Papers
Academic year of topic announcement: 2006/2007
Thesis type: diploma thesis
Thesis language:
Department: Department of Software Engineering (32-KSI)
Supervisor: prof. RNDr. Tomáš Skopal, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 14.11.2006
Date of assignment: 14.11.2006
Guidelines
Navrhněte model a heuristiky pro odhalování podobných částí různých odborných textů, na základě podobnosti vět, odstavců, atd. Podobnost je reprezentována editační vzdáleností, LCSS, případně jinými. Zaindexujte pro rychlejší vyhledávání některou z metrických přístupových metod. Odlaďte metodu na kolekci PDF souborů vědeckých textů a vypracujte případovou studii na středně velké kolekci (cca 10000 dokumentů).
References
1) Zezula P, Amato G, Dohnal V, Batko M: Similarity Search - The Metric Space Approach, Springer, 2006

2) Gusfield D.: Algorithms on Strings, Trees and Sequences - Computer Science and Computational Biology, Cambridge University Press, 1997

3) Baeza-Yates R.A, Ribeiro-Neto B.A.: Modern Information Retrieval, ACM Press / Addison-Wesley, 1999
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html