Vyhodnocování podobnosti zdrojových textů
Název práce v češtině: | Vyhodnocování podobnosti zdrojových textů |
---|---|
Název v anglickém jazyce: | Source codes similarity evaluation |
Akademický rok vypsání: | 2006/2007 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Katedra softwaru a výuky informatiky (32-KSVI) |
Vedoucí / školitel: | RNDr. Tomáš Holan, Ph.D. |
Řešitel: | skrytý![]() |
Datum přihlášení: | 23.10.2006 |
Datum zadání: | 23.10.2006 |
Datum a čas obhajoby: | 26.06.2007 00:00 |
Datum odevzdání elektronické podoby: | 26.06.2007 |
Datum odevzdání tištěné podoby: | 23.10.2006 |
Datum proběhlé obhajoby: | 26.06.2007 |
Oponenti: | RNDr. Jiří Dokulil, Ph.D. |
Zásady pro vypracování |
Cílem projektu je vytvořit program, který bude porovnávat zdrojové texty.
Míra podobnosti bude počítána pomocí několika různých dílčích měr, počítajících podobnost co možná nejrůznějšími způsoby. Součástí projektu bude také databáze zdrojových textů. Pomocí webového rozhraní uživatel bude moci spouštět porovnávání - zdrojový text bude porovnáván se všemi (nebo s určitou podmnožinou) zdrojových textů v databázi, výstupem budou nejpodobnější zdrojové texty. Dále bude součástí projektu rozhraní pro správu databáze, spouštění hromadných porovnání atp. Účelem programu je pomoci v rozpoznávání, zda zdrojové texty jsou odvozené jeden od druhého. |
Seznam odborné literatury |
[1]: String Similarity Metrics for Information Integration
http://www.dcs.shef.ac.uk/~sam/stringmetrics.html [2] Winnowing: Local Algorithms for Document Fingerprinting http://theory.stanford.edu/~aiken/publications/papers/sigmod03.pdf |
Předběžná náplň práce |
Program pro vyhodnocování podobnosti zdrojových textů. |
Předběžná náplň práce v anglickém jazyce |
Program evaluating similarity of source codes. |