Dynamická detekce plagiátů
| Název práce v češtině: | Dynamická detekce plagiátů |
|---|---|
| Název v anglickém jazyce: | Detection of Plagiarism |
| Akademický rok vypsání: | 2007/2008 |
| Typ práce: | diplomová práce |
| Jazyk práce: | čeština |
| Ústav: | Katedra softwarového inženýrství (32-KSI) |
| Vedoucí / školitel: | RNDr. Leo Galamboš, Ph.D. |
| Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
| Datum přihlášení: | 14.11.2007 |
| Datum zadání: | 14.11.2007 |
| Datum a čas obhajoby: | 02.02.2009 00:00 |
| Datum odevzdání elektronické podoby: | 02.02.2009 |
| Datum proběhlé obhajoby: | 02.02.2009 |
| Oponenti: | RNDr. Matúš Ondreička, Ph.D. |
| Zásady pro vypracování |
| - prostudujte strukturu projektu egothor2
- porovnejte způsoby řešení odstraňování duplicit - navrněte metody detekce plagiátů pro dynamicky se měnící báze dokumentů - rozšiřte na úroveň odstavců - implementujte |
| Seznam odborné literatury |
| Leo Galambos: Egothor2, http://www.egothor.org/docs/e2.pdf
Jakub Podhorny: Transakce ve fulltextovém vyhledávacím stroji, diplomova prace MFF UK 2007. Soumen Chakrabarti: Mining the Web: Discovering Knowledge from Hypertext Data. Amsterdam: Morgan Kaufmann, 2003. Ricardo Baeza-Yates, Berthier Ribeiro-Neto: Modern Information Retrieval. Addison Wesley, 1999. Ian H. Witten, Alistair Moffat, and Timothy C. Bell: Managing Gigabytes: Compressing and Indexing Documents and Images. Van Nostrand Reinhold, 1994. |
| Předběžná náplň práce |
| Detekce plagiátů je v současnosti závažný problém a jeho odhalování vyžaduje poměrně veliký výpočetní výkon. Podobný problém řešily i vyhledávače při redukci duplicit. Práce se proto zabývá rozšířením postupů z webového vyhledávání na dynamicky se měnící báze (vědeckých) textů za účelem efektivního odhalování plagiátů. |
| Předběžná náplň práce v anglickém jazyce |
| Plagiarism detection has become a serious issue and the process consumes a lot of CPU power. A similar issue was recognized by the Web search engines, because they also try to eliminate duplicities in their indices.
This work studies the classic algorithms developed for the Web search, and adapts them to the world of a dynamic document base of (scientific) articles. The effective implementation is also provided on top of the egothor2 platform. |
- zadáno a potvrzeno stud. odd.