Statistické metody v systémech pro dobývání znalostí z dat - NDBX031
Anglický název: Statistical Methods in Data Mining Systems
Zajišťuje: Studijní oddělení (32-STUD)
Fakulta: Matematicko-fyzikální fakulta
Platnost: od 2019
Semestr: zimní
E-Kredity: 3
Rozsah, examinace: zimní s.:1/1, Z+Zk [HT]
Počet míst: neomezen
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Je zajišťováno předmětem: NDBI031
Další informace: http://www.cs.cas.cz/~martin/vyuka.html
Garant: prof. RNDr. Ing. Martin Holeňa, CSc.
Třída: Informatika Mgr. - Matematická lingvistika
Kategorizace předmětu: Informatika > Databázové systémy
Prerekvizity : {NXXX038, NXXX039, NXXX040, NXXX067, NXXX069}
Neslučitelnost : NDBI031
Záměnnost : NDBI031
Výsledky anket   Termíny zkoušek   Rozvrh ZS   Nástěnka   
Anotace -
Dobývání znalostí z dat spočívá metodologicky na strojovém učení, statistice a teorii databází. Tento předmět je prvním ze dvou zabývajících se souvislostí dobývání znalostí z dat a statistiky. Podává přehled statistických metod implementovaných v klíčových příkladech tří hlavních typů komerčních systémů pro dobývání znalostí z dat, jakož i v jednom akademickém systému, používaném na několika vysokých školách, včetně MFF. V letním semestru na něj volně navazuje předmět NAIL105 Internet a klasifikační metody.
Poslední úprava: T_KTI (05.04.2016)
Cíl předmětu -

Naučit základní statistické metody dobývání znalostí z dat.

Poslední úprava: Holeňa Martin, prof. RNDr. Ing., CSc. (29.06.2019)
Podmínky zakončení předmětu -

Předvedení vysledků úkolů ze cvičení.

Poslední úprava: Holeňa Martin, prof. RNDr. Ing., CSc. (29.06.2019)
Literatura -
  • Martin Holeňa. Statistické aspekty dobývání znalostí z dat. Praha, nakladatelství Karolinum, 2006, skripta.
  • M. Berthold, D.J. Hand. Intelligent Data Analysis. Berlin, Springer, 1999

Poslední úprava: T_KTI (05.04.2016)
Metody výuky

Jednou za 2 týdny 2 hodiny přednášky, ktere studenti se zájmem o získání zápočtu doplňují cvičeními v prostředí Matlab, s časovou náročností rovnež zhruba 2 hodiny za 2 týdny. Cvičení mohou studenti vypracovat samostatně doma a vyučujíciho podle potřeby kontaktovat kvůli konzultacím.

Poslední úprava: HOLENA/MFF.CUNI.CZ (04.10.2008)
Požadavky ke zkoušce

Předvedení vysledků cvičení.

Poslední úprava: HOLENA/MFF.CUNI.CZ (02.10.2008)
Sylabus -

Dobývání znalostí z dat, které jako samostatná oblast na styku matematiky a informatiky existuje od první poloviny devadesátých let, spočívá metodologicky na strojovém učení, statistice a teorii databází. Zatímco metody strojového učení a databáze jsou náplní jiných přednášek, tento předmět je prvním ze dvou zabývajících se souvislostí dobývání znalostí z dat a statistiky. Podává přehled statistických metod implementovaných v klíčových příkladech tří hlavních typů komerčních systémů pro dobývání znalostí z dat, jakož i v jednom akademickém systému, používaném na několika vysokých školách, včetně MFF. V letním semestru na něj volně navazuje předmět DBI029: Statistické aspekty dobývání znalostí z dat.

  • Dobývání znalostí z dat a jeho souvislost se statistikou
  • Hlavní typy systémů pro dobývání znalostí z dat
  • Statistické metody v Clementine, příkladu obecného systému pro dobývání znalostí z dat
  • Statistické metody v DecisionSite, příkladu systému pro on-line podporu rozhodování pomocí dobývání znalostí z dat
  • Systém Matlab jako příklad univerzálnějšího systému zahrnujícího metody pro dobývání znalostí z dat
  • Popisné statistiky v systému Matlab
  • Lineární regrese a její zobecnění v systému Matlab
  • Mnohorozměrná statistická analýza v systému Matlab
  • Testování hypotéz v systému Matlab
  • 4FT-Miner - akademický systém pro dobývání znalostí z dat kombinující observační logiku a analýzu čtyřpolních tabulek
  • Kvantifikátory observační logiky založené na odhadech parametrů
  • Kvantifikátory observační logiky založené na testování hypotéz

Poslední úprava: Holeňa Martin, prof. RNDr. Ing., CSc. (24.04.2006)