Data Science

Tento předmět slouží pro porozumění, co zahrnuje dnes velmi populární obor Data Science.

V rámci předmětu se studenti seznámí s metodikou Data Science projektu a s potřebnými znalostmi a dovednostmi. Souběžně si prakticky vyzkoušejí zpracování malého projektu od vstupních dat a zadání úlohy po sestavení modelu a vypracování podrobného analytického reportu.

Předmět se vyučuje nově od zimního semestru 2021/22 jako povinně-volitelný na magisterském studiu oboru Informatika, MFF UK, a to v budově na Malostranském náměstí.

Prohlédnout sylabus předmětu

Informace pro posluchače:

Přednáška i cvičení se konají prezenčně v budově MFF UK na Malostranském náměstí. Výuka probíhá každou středu, a to přednáška od 9:00 do 10:30 v S3, následně cvičení od 10:40 do 12:10 v SW1.

Semestr:

zimní

Rozsah:

2/2 Z, Zk

Přednášející a cvičící:

doc. Irena Holubová (KSI MFF UK), Petr Paščenko, Jan Hučín, Dominik Matula, Sergii Stamenov

Kód předmětu:

NDBI048

Uzavření předmětu:

získaný zápočet a složená zkouška

Požadavky na zápočet:

Vypracování zprávy o analýze a modelování nad daty, které student dostane přidělené nebo si po dohodě sám vybere. Hlavními kritérii jsou strukturovanost a srozumitelnost reportu, schopnost soustředit se na podstatné věci a z dat vyvodit závěry. Předpokládá se aktivní použití metod a technologií probraných během semestru.

Požadavky na zkoušku:

Zkouška proběhne formou písemného testu. Do hodnocení zkoušky je možné připočítat body, které student získal během semestru nad rámec zápočtového limitu.

plán přednášek a cvičení

5. 10. 2022
Organizace, klasifikační požadavky, co je to Data Science
12. 10. 2022
Technologie pro Data Science I
19. 10. 2022
Metody explorace a vizualizace
26. 10. 2022
Fáze DS projektu. Business understanding, data understanding
2. 11. 2022
Tvorba srozumitelného reportu
9. 11. 2022
Děkanský den, výuka zrušena
16. 11. 2022
Příprava dat (data preparation)
23. 11. 2022
Modelování I – základní metody a metriky
30. 11. 2022
Modelování II – bayesiánský přístup
7. 12. 2022
Technologie pro Data Science II
14. 12. 2022
Úvod do moderních DB systémů
21. 12. 2022
Big Data Science, MapReduce, Spark
4. 1. 2023
Limity statistických metod a zkreslení, Manažerský pohled na Data Science