Vyhodnocování podobnosti zdrojových textů
Thesis title in Czech: | Vyhodnocování podobnosti zdrojových textů |
---|---|
Thesis title in English: | Source codes similarity evaluation |
Academic year of topic announcement: | 2006/2007 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Department of Software and Computer Science Education (32-KSVI) |
Supervisor: | RNDr. Tomáš Holan, Ph.D. |
Author: | hidden![]() |
Date of registration: | 23.10.2006 |
Date of assignment: | 23.10.2006 |
Date and time of defence: | 26.06.2007 00:00 |
Date of electronic submission: | 26.06.2007 |
Date of submission of printed version: | 23.10.2006 |
Date of proceeded defence: | 26.06.2007 |
Opponents: | RNDr. Jiří Dokulil, Ph.D. |
Guidelines |
Cílem projektu je vytvořit program, který bude porovnávat zdrojové texty.
Míra podobnosti bude počítána pomocí několika různých dílčích měr, počítajících podobnost co možná nejrůznějšími způsoby. Součástí projektu bude také databáze zdrojových textů. Pomocí webového rozhraní uživatel bude moci spouštět porovnávání - zdrojový text bude porovnáván se všemi (nebo s určitou podmnožinou) zdrojových textů v databázi, výstupem budou nejpodobnější zdrojové texty. Dále bude součástí projektu rozhraní pro správu databáze, spouštění hromadných porovnání atp. Účelem programu je pomoci v rozpoznávání, zda zdrojové texty jsou odvozené jeden od druhého. |
References |
[1]: String Similarity Metrics for Information Integration
http://www.dcs.shef.ac.uk/~sam/stringmetrics.html [2] Winnowing: Local Algorithms for Document Fingerprinting http://theory.stanford.edu/~aiken/publications/papers/sigmod03.pdf |
Preliminary scope of work |
Program pro vyhodnocování podobnosti zdrojových textů. |
Preliminary scope of work in English |
Program evaluating similarity of source codes. |