Data Science

Tento předmět slouží pro porozumění, co zahrnuje dnes velmi populární obor Data Science.

V rámci předmětu se studenti seznámí s metodikou Data Science projektu a s potřebnými znalostmi a dovednostmi. Souběžně si prakticky vyzkoušejí zpracování malého projektu od vstupních dat a zadání úlohy po sestavení modelu a vypracování podrobného analytického reportu.

Předmět se vyučuje jako povinně-volitelný na magisterském studiu oboru Informatika, MFF UK, a to v budově na Malostranském náměstí.

Prohlédnout sylabus předmětu

Informace pro posluchače:

Výuka se koná ve středu, a to nejdřív přednáška 9.00–10.30 v S4, poté cvičení 10.40–12.10 taktéž v S4, výuka je prezenční a v češtině, materiály pro studenty připravujeme v angličtině.

Výuka v semestru začíná v pondělí 2. 10. 2023 a končí v pátek 12. 1. 2024 s vánoční přestávkou od 23. 12. do 2. 1.

Semestr:

zimní

Rozsah:

2/2 Z, Zk

Přednášející a cvičící:

doc. Irena Holubová (KSI MFF UK), Petr Paščenko, Jan Hučín, Dominik Matula

Kód předmětu:

NDBI048

Uzavření předmětu:

získaný zápočet a složená zkouška

Požadavky na zápočet:

Vypracování zprávy o analýze a modelování nad daty, které student dostane přidělené nebo si po dohodě sám vybere. Hlavními kritérii jsou strukturovanost a srozumitelnost reportu, schopnost soustředit se na podstatné věci a z dat vyvodit závěry. Předpokládá se aktivní použití metod a technologií probraných během semestru.

Požadavky na zkoušku:

Zkouška proběhne formou písemného testu. Do hodnocení zkoušky je možné připočítat body, které student získal během semestru nad rámec zápočtového limitu.

plán přednášek a cvičení

4. 10. 2023
Organizace, klasifikační požadavky, co je to Data Science, CRISP-DM
11. 10. 2023
Technologie pro Data Science I
18. 10. 2023
Tvorba srozumitelného reportu
25. 10. 2023
Business understanding, Data understanding
1. 11. 2023
Metody explorace a vizualizace
8. 11. 2023
Příprava dat (data preparation)
15. 11. 2023
Modelování I – základní principy
22. 11. 2023
Modelování II – výběr modelu v praxi
29. 11. 2023
Racionalistické konsekvence
6. 12. 2023
Technologie pro Data Science II
13. 12. 2023
Úvod do moderních DB systémů
20. 12. 2023
Big Data Science, MapReduce, Spark
3. 1. 2024
Limity statistických metod a zkreslení
10. 1. 2024
Manažerský pohled Ukázky z praktických projektů