Detekce plagiátů v odborných textech
Thesis title in Czech: | Detekce plagiátů v odborných textech |
---|---|
Thesis title in English: | Plagiarism Detection in Research Papers |
Academic year of topic announcement: | 2006/2007 |
Thesis type: | diploma thesis |
Thesis language: | |
Department: | Department of Software Engineering (32-KSI) |
Supervisor: | prof. RNDr. Tomáš Skopal, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 14.11.2006 |
Date of assignment: | 14.11.2006 |
Guidelines |
Navrhněte model a heuristiky pro odhalování podobných částí různých odborných textů, na základě podobnosti vět, odstavců, atd. Podobnost je reprezentována editační vzdáleností, LCSS, případně jinými. Zaindexujte pro rychlejší vyhledávání některou z metrických přístupových metod. Odlaďte metodu na kolekci PDF souborů vědeckých textů a vypracujte případovou studii na středně velké kolekci (cca 10000 dokumentů). |
References |
1) Zezula P, Amato G, Dohnal V, Batko M: Similarity Search - The Metric Space Approach, Springer, 2006
2) Gusfield D.: Algorithms on Strings, Trees and Sequences - Computer Science and Computational Biology, Cambridge University Press, 1997 3) Baeza-Yates R.A, Ribeiro-Neto B.A.: Modern Information Retrieval, ACM Press / Addison-Wesley, 1999 |