Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Vyhodnocování podobnosti zdrojových textů
Název práce v češtině: Vyhodnocování podobnosti zdrojových textů
Název v anglickém jazyce: Source codes similarity evaluation
Akademický rok vypsání: 2006/2007
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Katedra softwaru a výuky informatiky (32-KSVI)
Vedoucí / školitel: RNDr. Tomáš Holan, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 23.10.2006
Datum zadání: 23.10.2006
Datum a čas obhajoby: 26.06.2007 00:00
Datum odevzdání elektronické podoby:26.06.2007
Datum odevzdání tištěné podoby:23.10.2006
Datum proběhlé obhajoby: 26.06.2007
Oponenti: RNDr. Jiří Dokulil, Ph.D.
 
 
 
Zásady pro vypracování
Cílem projektu je vytvořit program, který bude porovnávat zdrojové texty.

Míra podobnosti bude počítána pomocí několika různých dílčích měr, počítajících podobnost co možná nejrůznějšími způsoby.

Součástí projektu bude také databáze zdrojových textů. Pomocí webového rozhraní uživatel bude moci spouštět porovnávání - zdrojový text bude porovnáván se všemi (nebo s určitou podmnožinou) zdrojových textů v databázi, výstupem budou nejpodobnější zdrojové texty. Dále bude součástí projektu rozhraní pro správu databáze, spouštění hromadných porovnání atp.

Účelem programu je pomoci v rozpoznávání, zda zdrojové texty jsou odvozené jeden od druhého.
Seznam odborné literatury
[1]: String Similarity Metrics for Information Integration
http://www.dcs.shef.ac.uk/~sam/stringmetrics.html
[2] Winnowing: Local Algorithms for Document Fingerprinting
http://theory.stanford.edu/~aiken/publications/papers/sigmod03.pdf
Předběžná náplň práce
Program pro vyhodnocování podobnosti zdrojových textů.
Předběžná náplň práce v anglickém jazyce
Program evaluating similarity of source codes.
 
Univerzita Karlova | Informační systém UK