The course introduces modern algorithms and principles used in the field
of information retrieval in large data collections. The students will
gain practical knowledge and experience with experimentation and
evaluation on real data. A special focus is given to web search.
Last update: T_UFAL (13.05.2014)
Přednáška seznámí posluchače s moderními algoritmy a principy
používanými v oblasti vyhledávání informací v rozsáhlých datových
kolekcích. Posluchači získají praktické vědomosti a zkušenosti s
prováděním a vyhodnocováním experimentů na reálných datech. Zvláštní
pozornost je věnována vyhledávání informací na webu.
Course completion requirements -
Last update: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Both the course credit and exam are required to complete the course.
The course credit will be given after completing two homework assignments.
The final grade will be based on the results of the exam and homework.
Last update: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
K absolvování předmětu je zapotřebí zápočet i zkouška.
Zápočet bude udělen po splnění dvou domácích úkolů.
Výsledná známka bude záviset na výsledcích zkoušky a řešení domácích úkolů.
Literature -
Last update: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. ISBN 0521865719.
Last update: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. ISBN 0521865719.
Requirements to the exam -
Last update: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
The exam is in a form of a written test with approximately 20 short-answer questions covered by the topics discussed during the course.
Last update: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Zkouška je formou písemného testu s přibližně 20 otázkami vyžadujícími stručné odpovědi na témata diskutovaná během přednášek.
Syllabus -
Last update: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)
Introduction, basic concepts and principles
Boolean retrieval
Indexing
Vector space model
Evaluation in information retrieval
Query expansion
Probabilistic information retrieval
Language models for information retrieval
Text classification
Clustering
Web search
Near-duplicate detection
Last update: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)