Strojové učení v praxi

Účelem tohoto předmětu je seznámit studenty s tím, jak vypadá dnes velmi populární obor Data Science v praxi, a to s ohledem na postupy strojového učení.

V rámci předmětu se studenti seznámí s metodikou Data Science projektu v praxi a s návazností samotného strojového učení na další nutné činnosti. Souběžně si prakticky vyzkoušejí zpracování malého projektu od vstupních dat a zadání úlohy po sestavení modelu a vypracování podrobného analytického reportu.

Předmět se vyučuje nově od zimního semestru 2023/24 jako volitelný na magisterském studiu oboru Znalostní inženýrství FIT ČVUT.

Informace pro posluchače:

Přednáška i cvičení se konají prezenčně v budově FIT ČVUT v Dejvicích. Výuka probíhá každé pondělí, a to přednáška od 11:00 do 12:30 v T9:346, v lichých týdnech následně cvičení (první lichý týden je 25. 9.) od 12:45 do 14:15 v T9:303.

Semestr:

zimní

Rozsah:

2/1 Z, Zk

Přednášející a cvičící:

Jan Hučín, Petr Paščenko, Dominik Matula

Kód předmětu:

NI-MLP

Uzavření předmětu:

získaný zápočet a složená zkouška

Požadavky na zápočet:

Vypracování zprávy o analýze a modelování nad daty, které student dostane přidělené nebo si po dohodě sám vybere. Hlavními kritérii jsou strukturovanost a srozumitelnost reportu, schopnost soustředit se na podstatné věci a z dat vyvodit závěry. Předpokládá se aktivní použití metod a technologií probraných během semestru.

Požadavky na zkoušku:

Zkouška proběhne formou písemného testu a krátkého pohovoru nad jeho výsledky. Do hodnocení zkoušky je možné připočítat body, které student získal během semestru nad rámec zápočtového limitu.

plán přednášek a cvičení

25. 9. 2023
Úvod, metodika CRISP a Business understanding (přednáška)
25. 9. 2023
Přehled základních technologií pro analýzu a zpracování dat (cvičení)
2. 10. 2023
Statistická inference (přednáška)
9. 10. 2023
Data understanding. Metody explorace a vizualizace dat (přednáška)
9. 10. 2023
Exploratorní analýza vzorových dat, profiling, vizualizace (cvičení)
16. 10. 2023
Tvorba srozumitelného reportu (přednáška)
23. 10. 2023
Aplikovaný bayesianismus (přednáška)
23. 10. 2023
Bayesovské počítání, víceruký bandita (cvičení)
30. 10. 2023
Praxe modelování a hodnocení modelů (přednáška)
6. 11. 2023
Data preparation, čištění dat (přednáška)
6. 11. 2023
Transformace dat a extrakce příznaků na praktických datech (cvičení)
13. 11. 2023
Využití technologií pro Big Data (přednáška)
20. 11. 2023
Interpretabilita modelů (přednáška)
20. 11. 2023
Sestavení referenčního modelu a jeho vylepšování na praktických datech (cvičení)
27. 11. 2023
Limity statistických metod (přednáška)
4. 12. 2023
Aplikace principů SW inženýrství (přednáška)
4. 12. 2023
Práce s MLFlow, data pipeline (cvičení)
11. 12. 2023
Ukázky z praktických projektů (přednáška)
18. 12. 2023
Co se nevešlo do předchozích přednášek (přednáška)
18. 12. 2023
Prostor pro samostatnou práci (cvičení)