Your browser does not support JavaScript, or its support is disabled. Some features may not be available.
Information Retrieval Systems - NDBI010
Annotation -
--- Czech English
Last update: Ing. Ladislav Kopecký (16.04.2005)
String matching algorithms. Searching and data retrieval from text databases. Architecture of text retrieval systems. Text compression. Corrections of texts in a natural language.
Vyhledávání a výběr dat z textových databází. Architektura
dokumentografických informačních systémů. Komprese textu. Oprava textů v
přirozeném jazyce.
Last update: Ing. Ladislav Kopecký (10.04.2005)
Pokorný J., Snášel V., Húsek D.: Dokumentograficé informační systémy. Skripta UK, 1999
Melichar B.: Textové informační systémy. Skripta ČVUT, 1994
Syllabus -
--- Czech English
Last update: Ing. Ladislav Kopecký (03.05.2005)
Introduction
History and evolution of text retrieval systems
Differences between factographical and text retrieval systems
Pattern matching algorithms
Left-to-rights algorithms
Knuth-Morris-Pratt algorithm
Regular expressions and finite state automata
Commentz-Walter algorithm
Butzilowsky?s two-way finite state jump automata
Architecture of text retrieval systems
Boolean text retrieval systems
Vector-based text retrieval systems
Signature-based text retrieval methods
Inductive methods, spreading algorithms
Systems based on fuzzy logic
Document indexing
Automatical document indexing
Selection of appropriate terms
Term importance assignment
Implementation of text retrieval systems
Clustering algorithms for vector-based systems
Concepts in vector-based systems
Algorithms for approximate pattern matching
Hamming and Levenshtein metrics
Construction of finite state automata for approximate pattern matching
Corrections of texts in a natural language.
Textual data compression
Compression of integer numbers
Statical versus adaptive algorithms
Huffman encoding, word-based compression
Last update: Ing. Ladislav Kopecký (03.05.2005)
Úvod do problematiky informačních systémů
Historie a vývoj vyhledávání v textech
Rozdíly mezi faktografickými a dokumentografickými IS
Algoritmy pro přesné vyhledávání v textech
Triviální algoritmus vyhledávání hrubou silou
Algoritmy pro dopředné (sousměrné) vyhledávání
Knuth-Morris-Prattův algoritmus
Aho-Corasickové algoritmus
Vyhledávání regulárních výrazů konečnými automaty
Algoritmy pro nesousměrné vyhledávání
Algoritmus Commentz-Walter
Butzilowského dvojcestný konečný automat se skokem
Dokumentografické informační systémy
Induktivní DIS, spreading
Systémy využívající fuzzy logiku
Indexace dokumentů
Automatická indexace dokumentů
Stanovení důležitosti termu
Implementace indexových systémů
Shlukovací algoritmy pro vektorový model
Tvorba konceptů pro vektorový model
Algoritmy pro přibližné vyhledávání v textech
Hammingova a Levenshteinova metrika
Konstrukce vyhledávacího stroje pro přibližné vyhledávání
Komprese dat v DIS
Komprese přirozených čísel
Statické versus adaptivní algoritmy
Huffmanovo kódování, komprese po slovech