Vyhľadávanie relevantných článkov v rozsiahlych kolekciách
Thesis title in thesis language (Slovak): | Vyhľadávanie relevantných článkov v rozsiahlych kolekciách |
---|---|
Thesis title in Czech: | Vyhľadávanie relevantných článkov v rozsiahlych kolekciách |
Thesis title in English: | Searching relevant articles in extensive collections |
Key words: | vyhľadávanie informácií, tf-idf, morfológia, stemming |
English key words: | information retrieval, tf-idf, morphology, stemming |
Academic year of topic announcement: | 2010/2011 |
Thesis type: | Bachelor's thesis |
Thesis language: | slovenština |
Department: | Department of Software Engineering (32-KSI) |
Supervisor: | Ing. Jiří Novák, Ph.D. |
Author: | hidden![]() |
Date of registration: | 10.11.2010 |
Date of assignment: | 10.11.2010 |
Date and time of defence: | 06.09.2012 10:30 |
Date of electronic submission: | 24.07.2012 |
Date of submission of printed version: | 25.07.2012 |
Date of proceeded defence: | 06.09.2012 |
Opponents: | RNDr. Tomáš Bartoš, Ph.D. |
Guidelines |
Cieľom práce bude navrhnúť systém schopný nájsť relevantné články k článkom zadaným na vstupe. Naviac bude navrhnutý tak, aby podporoval efektívne vyhľadávanie v rozsiahlych kolekciách článkov. Systém bude optimalizovaný pre český jazyk. Využije českú morfológiu na rozpoznanie významovo rovnakých slov v rôznych tvaroch. Využitý pritom bude stemmer, stopwords a rozpoznávanie synoným. Súčasťou práce bude implementácia systému na spravodajskej web stránke s návrhmi relevantných článkov na konci každého práve otvoreného článku a implementácia kontextovej reklamy. |
References |
[1] Richard Sproat. Morphology and Computation. MIT Press, Cambridge, Massachusetts, 1992.
[2] Ljiljana Dolamic, Jacques Savoy. Stemming Approaches for East European Languages. University of Neuchatel, Switzerland, 2007. [3] Pavel Češka and Pavel Pecina. Charles University at CLEF 2007 Ad-Hoc Track. Charles University, Prague, Czech republic, 2007. [4] Prasenjit Majumder, Mandar Mitra, Dipasree Pal. Hungarian and Czech Stemming using YASS. Indian Statistical Institute, Kolkata, 2007. |