Vyhledávání informací - NPFL103
Anglický název: Information Retrieval
Zajišťuje: Ústav formální a aplikované lingvistiky (32-UFAL)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2020
Semestr: zimní
E-Kredity: 5
Rozsah, examinace: zimní s.:2/2, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
Virtuální mobilita / počet míst: ne
Stav předmětu: vyučován
Jazyk výuky: angličtina, čeština
Způsob výuky: prezenční
Další informace: https://ufal.mff.cuni.cz/courses/npfl103
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: doc. RNDr. Pavel Pecina, Ph.D.
Neslučitelnost : NPFX103
Záměnnost : NPFX103
Je neslučitelnost pro: NPFX103
Je záměnnost pro: NPFX103
Výsledky anket   Termíny zkoušek   Rozvrh ZS   Nástěnka   
Anotace -
Poslední úprava: T_UFAL (13.05.2014)
Přednáška seznámí posluchače s moderními algoritmy a principy používanými v oblasti vyhledávání informací v rozsáhlých datových kolekcích. Posluchači získají praktické vědomosti a zkušenosti s prováděním a vyhodnocováním experimentů na reálných datech. Zvláštní pozornost je věnována vyhledávání informací na webu.
Podmínky zakončení předmětu -
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)

K absolvování předmětu je zapotřebí zápočet i zkouška.

Zápočet bude udělen po splnění dvou domácích úkolů.

Výsledná známka bude záviset na výsledcích zkoušky a řešení domácích úkolů.

Literatura -
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)

Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. ISBN 0521865719.

Požadavky ke zkoušce -
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)

Zkouška je formou písemného testu s přibližně 20 otázkami vyžadujícími stručné odpovědi na témata diskutovaná během přednášek.

Sylabus -
Poslední úprava: doc. RNDr. Pavel Pecina, Ph.D. (04.05.2022)

Úvod, základní pojmy a principy

Boolský model

Indexování

Vektorový model

Evaluace ve vyhledávání informací

Rozšiřování dotazů

Pravděpodobnostní modely

Jazykové modely

Klasifikace textu

Shlukování dokumentů

Hledání na webu

Hledání blízkých duplicit