Data Science

Tento předmět slouží pro porozumění, co zahrnuje dnes velmi populární obor Data Science.

V rámci předmětu se studenti seznámí s metodikou Data Science projektu a s potřebnými znalostmi a dovednostmi. Souběžně si prakticky vyzkoušejí zpracování malého projektu od vstupních dat a zadání úlohy po sestavení modelu a vypracování podrobného analytického reportu.

Předmět se vyučuje nově od zimního semestru 2021/22 jako povinně-volitelný na magisterském studiu oboru Informatika, MFF UK, a to v budově na Malostranském náměstí.

Prohlédnout sylabus předmětu

Informace pro posluchače:

Přednáška i cvičení se konají prezenčně v budově MFF UK na Malostranském náměstí. Přednáška se koná ve čtvrtek 12:20–13:50 v posluchárně S5, cvičení vzápětí 14:00–15:30 v labu SW1.

Semestr:

zimní

Rozsah:

2/2 Z, Zk

Přednášející a cvičící:

doc. Irena Holubová (KSI MFF UK), Petr Paščenko, Jan Hučín, Dominik Matula, Sergii Stamenov

Kód předmětu:

NDBI048

Uzavření předmětu:

získaný zápočet a složená zkouška

Požadavky na zápočet:

Vypracování zprávy o analýze a modelování nad daty, které student dostane přidělené nebo si po dohodě sám vybere. Hlavními kritérii jsou strukturovanost a srozumitelnost reportu, schopnost soustředit se na podstatné věci a z dat vyvodit závěry. Předpokládá se aktivní použití metod a technologií probraných během semestru.

Požadavky na zkoušku:

Zkouška proběhne formou písemného testu. Do hodnocení zkoušky je možné připočítat body, které student získal během semestru nad rámec zápočtového limitu.

plán přednášek a cvičení

30. 9. 2021
Organizace, klasifikační požadavky, co je to Data Science
7. 10. 2021
Technologie pro Data Science I
14. 10. 2021
Fáze DS projektu. Business understanding, data understanding
21. 10. 2021
Metody explorace a vizualizace
28. 10. 2021
*státní svátek, výuka zrušena
4. 11. 2021
Tvorba srozumitelného reportu
11. 11. 2021
Příprava dat (data preparation)
18. 11. 2021
Modelování I – základní metody a metriky
25. 11. 2021
Modelování II – bayesiánský přístup
2. 12. 2021
Technologie pro Data Science II
9. 12. 2021
Úvod do moderních DB systémů
16. 12. 2021
Big Data Science, MapReduce, Spark
6. 1. 2022
Limity statistických metod a zkreslení, Manažerský pohled na Data Science