Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Klasifikace obsahu dokumentů
Thesis title in Czech: Klasifikace obsahu dokumentů
Thesis title in English: Classification of document contents
Academic year of topic announcement: 2007/2008
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Department of Applied Mathematics (32-KAM)
Supervisor: Mgr. Martin Mareš, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 06.11.2007
Date of assignment: 06.11.2007
Date and time of defence: 15.09.2009 00:00
Date of electronic submission:15.09.2009
Date of proceeded defence: 15.09.2009
Opponents: RNDr. Johanka Spoustová, Ph.D.
 
 
 
Guidelines
Cílem práce je prozkoumat algoritmy pro obsahovou klasifikaci webových stránek založené na statistických modelech používaných v komputační lingvistice a také na provázanosti dokumentů odkazy. Součástí práce by měl být empirický test navržené klasifikační metody na reálných datech.
References
Page L., Brin S., Motwani R., and Winograd T. The PageRank Citation Ranking: Bringing Order to the Web. Technical report, Department of Computer Science, Stanford University, 1998.
Santini M. Identifying Genres of Web Pages, TALN 2006 - Natural Language Processing: April 10-12, 2006 in Leuven.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html