Thesis (Selection of subject)Thesis (Selection of subject)(version: 390)
Thesis details
   Login via CAS
Vyhodnocování podobnosti zdrojových textů
Thesis title in Czech: Vyhodnocování podobnosti zdrojových textů
Thesis title in English: Source codes similarity evaluation
Academic year of topic announcement: 2006/2007
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Department of Software and Computer Science Education (32-KSVI)
Supervisor: RNDr. Tomáš Holan, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 23.10.2006
Date of assignment: 23.10.2006
Date and time of defence: 26.06.2007 00:00
Date of electronic submission:26.06.2007
Date of submission of printed version:23.10.2006
Date of proceeded defence: 26.06.2007
Opponents: RNDr. Jiří Dokulil, Ph.D.
 
 
 
Guidelines
Cílem projektu je vytvořit program, který bude porovnávat zdrojové texty.

Míra podobnosti bude počítána pomocí několika různých dílčích měr, počítajících podobnost co možná nejrůznějšími způsoby.

Součástí projektu bude také databáze zdrojových textů. Pomocí webového rozhraní uživatel bude moci spouštět porovnávání - zdrojový text bude porovnáván se všemi (nebo s určitou podmnožinou) zdrojových textů v databázi, výstupem budou nejpodobnější zdrojové texty. Dále bude součástí projektu rozhraní pro správu databáze, spouštění hromadných porovnání atp.

Účelem programu je pomoci v rozpoznávání, zda zdrojové texty jsou odvozené jeden od druhého.
References
[1]: String Similarity Metrics for Information Integration
http://www.dcs.shef.ac.uk/~sam/stringmetrics.html
[2] Winnowing: Local Algorithms for Document Fingerprinting
http://theory.stanford.edu/~aiken/publications/papers/sigmod03.pdf
Preliminary scope of work
Program pro vyhodnocování podobnosti zdrojových textů.
Preliminary scope of work in English
Program evaluating similarity of source codes.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html