Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.
Dokumentografické informační systémy - NDBI010
Anotace -
--- čeština angličtina
Vyhledávání a výběr dat z textových databází. Architektura
dokumentografických informačních systémů. Komprese textu. Oprava textů v
přirozeném jazyce.
Poslední úprava: Ing. Ladislav Kopecký (16.04.2005)
String matching algorithms. Searching and data retrieval from text databases. Architecture of text retrieval systems. Text compression. Corrections of texts in a natural language.
Poslední úprava: Ing. Ladislav Kopecký (10.04.2005)
Pokorný J., Snášel V., Húsek D.: Dokumentograficé informační systémy. Skripta UK, 1999
Melichar B.: Textové informační systémy. Skripta ČVUT, 1994
Sylabus -
--- čeština angličtina
Poslední úprava: Ing. Ladislav Kopecký (03.05.2005)
Úvod do problematiky informačních systémů
Historie a vývoj vyhledávání v textech
Rozdíly mezi faktografickými a dokumentografickými IS
Algoritmy pro přesné vyhledávání v textech
Triviální algoritmus vyhledávání hrubou silou
Algoritmy pro dopředné (sousměrné) vyhledávání
Knuth-Morris-Prattův algoritmus
Aho-Corasickové algoritmus
Vyhledávání regulárních výrazů konečnými automaty
Algoritmy pro nesousměrné vyhledávání
Algoritmus Commentz-Walter
Butzilowského dvojcestný konečný automat se skokem
Dokumentografické informační systémy
Induktivní DIS, spreading
Systémy využívající fuzzy logiku
Indexace dokumentů
Automatická indexace dokumentů
Stanovení důležitosti termu
Implementace indexových systémů
Shlukovací algoritmy pro vektorový model
Tvorba konceptů pro vektorový model
Algoritmy pro přibližné vyhledávání v textech
Hammingova a Levenshteinova metrika
Konstrukce vyhledávacího stroje pro přibližné vyhledávání
Komprese dat v DIS
Komprese přirozených čísel
Statické versus adaptivní algoritmy
Huffmanovo kódování, komprese po slovech
Poslední úprava: Ing. Ladislav Kopecký (03.05.2005)
Introduction
History and evolution of text retrieval systems
Differences between factographical and text retrieval systems
Pattern matching algorithms
Left-to-rights algorithms
Knuth-Morris-Pratt algorithm
Regular expressions and finite state automata
Commentz-Walter algorithm
Butzilowsky?s two-way finite state jump automata
Architecture of text retrieval systems
Boolean text retrieval systems
Vector-based text retrieval systems
Signature-based text retrieval methods
Inductive methods, spreading algorithms
Systems based on fuzzy logic
Document indexing
Automatical document indexing
Selection of appropriate terms
Term importance assignment
Implementation of text retrieval systems
Clustering algorithms for vector-based systems
Concepts in vector-based systems
Algorithms for approximate pattern matching
Hamming and Levenshtein metrics
Construction of finite state automata for approximate pattern matching
Corrections of texts in a natural language.
Textual data compression
Compression of integer numbers
Statical versus adaptive algorithms
Huffman encoding, word-based compression