PředmětyPředměty(verze: 945)
Předmět, akademický rok 2020/2021
   Přihlásit přes CAS
Data Science with R I - JEM221
Anglický název: Data Science with R I
Český název: Data Science with R I
Zajišťuje: Institut ekonomických studií (23-IES)
Fakulta: Fakulta sociálních věd
Platnost: od 2020 do 2020
Semestr: zimní
E-Kredity: 5
Způsob provedení zkoušky: zimní s.:kombinovaná
Rozsah, examinace: zimní s.:2/0, Zk [HT]
Počet míst: 1040 / neurčen (200)
Minimální obsazenost: neomezen
4EU+: ne
Virtuální mobilita / počet míst pro virtuální mobilitu: ne
Stav předmětu: vyučován
Jazyk výuky: angličtina
Způsob výuky: prezenční
Způsob výuky: prezenční
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
při zápisu přednost, je-li ve stud. plánu
Garant: prof. PhDr. Ladislav Krištoufek, Ph.D.
Vyučující: Mgr. Dominik Herman
prof. PhDr. Ladislav Krištoufek, Ph.D.
Třída: Courses not for incoming students
Neslučitelnost : JEM181
Je prerekvizitou pro: JEM220
Termíny zkoušek   Rozvrh   Nástěnka   
Anotace -
Poslední úprava: Mgr. Michaela Čuprová (06.05.2020)
Úvodní kurz pro Data Science se zaměřením na programovací prostředí R. Předmět uvádí do základního prakrického programování v prostředí R, zahrnující hodnocení modelů, memorizační metody, pokročilé regresní techniky a snižování rozptylu tréninkových vzorků. Na předmět Data Science with R I bude v letním semestru navazovat předmět Data Science with R II se zaměřením na shlukování, SVM, neurální sítě a obecnější síťové metody.
Cíl předmětu -
Poslední úprava: prof. PhDr. Ladislav Krištoufek, Ph.D. (23.10.2019)

Hlavním cílem kurzů Data Science with R I a II je naučit studenty pracovat v prostředí R tak, aby vhodně analyzovali data, a to i s užitím metod, které nejsou standardní součastí kurikula ekonometrie.

Literatura -
Poslední úprava: Mgr. Michaela Čuprová (06.05.2020)

Povinná literatura:

  • Ledolter, Johannes (2013): Data Mining and Business Analytics with R, John Wiley & Sons, Hoboken, New Jersey, NJ, USA
  • Toomey, Dan (2014): R for Data Science, Packt Publishing Ltd., Birmingham, UK
  • Zumel, Nina & Mount, John (2014): Practical Data Science with R, Manning Publications Co., Shelter Island, NY, USA

Další doporučená literatura:

  • Grolemung, Garret (2014): Hands-On Programming with R, O'Reilly Media Inc., Sebastopol, CA, USA
  • Ojeda, Tony et al. (2014): Practical Data Science Cookbook, Packt Publishing Ltd., Birmingham, UK
Požadavky ke zkoušce -
Poslední úprava: prof. PhDr. Ladislav Krištoufek, Ph.D. (04.10.2023)

Přepněte, prosím, do anglické verze.

Sylabus -
Poslední úprava: Mgr. Michaela Čuprová (06.05.2020)

Struktura výuky:

  • Týden #1: Course information + Introduction to Data Science 
  • Týden #2-#4: R basics (ZM 1, G 3-5)

  • Týden #5-6: Loading data, cleaning data, sampling (ZM 2-4) 

  • Týden #7: Model evaluation (ZM 5) 

  • Týden #8-#9: Memorization methods (ZM 6) 

  • Týden #10-#12: Advanced regression methods (linear, logistic, GAMs, LASSO, ridge) (ZM 7, T4-5)

Vstupní požadavky -
Poslední úprava: prof. PhDr. Ladislav Krištoufek, Ph.D. (23.10.2019)

Nejsou vstupní požadavky ani prerekvizity, ale očekává se znalost základních kvantitativních metod a logiky empirického výzkumu alespoň na úrovni Econometrics I + II a Statistics.

Požadavky k zápisu -
Poslední úprava: prof. PhDr. Ladislav Krištoufek, Ph.D. (23.10.2019)

Nejsou vstupní požadavky ani prerekvizity, ale očekává se znalost základních kvantitativních metod a logiky empirického výzkumu alespoň na úrovni Econometrics I + II a Statistics.

 
Univerzita Karlova | Informační systém UK