Sociální scoring a predikce úvěrů: Data Science odborná snídaně

Už na jaře jsme se v Profinitu těšili na uspořádání tradiční odborné snídaně na téma predikce úvěrů. Bohužel nám období karantény nepřálo, nicméně protože je data science snídaně vždy velmi očekávanou a hojně navštěvovanou událostí, rozhodli jsme se akci uspořádat v září.

Organizačně se jednalo o velice obtížný úkol a bylo nutné překonat spoustu překážek spojených s protikoronavirovými opatřeními a nejistotou při plánování. Náš skvělý organizační tým si však se vším poradil na výbornou a nakonec jsme v areálu hotelu Botanique přivítali více než 35 hostů.

Snídaně byla tematicky určena hlavně profesionálům z oblasti AI, datové analýzy a modelování. Zároveň jsme také milerádi přivítali ředitele a manažery především z bankovního sektoru, jichž se témata přímo dotýkala z byznysového pohledu. Vždyť hlavní částí snídaně byla prezentace výsledků našeho společného výzkumu predikce úvěrů s oddělením risku Equa bank a.s.

Společně s našimi partnery z Equa bank jsme totiž vytvořili propenzitní model pro identifikaci klientů, kteří v budoucnu zažádají o úvěrový produkt. Model kombinuje znalosti z našeho výzkumu pseudosociálních sítí a moderní postupy strojového učení. Výsledky, které prezentovali ředitel úvěrových rizik v Equa bank, pan Peter Baláži, a analytik týmu data science, pan Martin Hanzal, výrazně předčily naše očekávání. Porovnání predikovaných a realizovaných úvěrů na určeném časovém období jednoznačně prokázalo velmi dobrou využitelnost modelu na zhruba 70 % všech klientů banky, včetně méně aktivních segmentů!

Vedoucí našeho data science týmu Petr Paščenko pak ve své přednášce ukázal, jakým způsobem lze propenzitní model využít pro oslovování klientů a marketingové kampaně. Především ale představil způsob, jak je možné přímo posoudit finanční přínos nasazení propenzitního modelu do prostředí banky. Lahůdkou pro specialisty z oboru bylo nahlédnutí pod pokličku samotného fungování modelu včetně zcela inovativní aplikace grafových embeddingů pro extrakci příznaků z transakčních dat.

Ve druhém bloku potom kolega Petr Hála zahájil povídání o našem výzkumu modelování sociálních vazeb. Model pro odhalování klientů žijících ve společné domácnosti už máme nějaký ten pátek vyzkoušený. Nyní jsme do našeho řešení přidali anonymizovanou detekci přátel a osob, se kterými klienti tráví společný čas. Přednáška odhalila, jak může správná aplikace jednoduchého statistického konceptu pomoci vyčíst sociální vazby z transakcí mezi klienty a bankou.

Na samý závěr připravil náš DevOps specialista, Tomáš Karella, příspěvek o vývoji modelů a jejich nasazování do cloudu. Tento příspěvek byl velice zajímavý v tom, že nejenom ukázal výhody a nevýhody zpracování dat v cloudu, ale především jednoduše a zároveň velmi názorně popsal, co se skrývá za poslední dobou hojně skloňovaným označením „MLOps“.

Máme obrovskou radost, že se naše data science snídaně opravdu moc povedla, a těšíme se na další vydařenou akci!

 

Autor: Lukáš Dvořák

Big Data & Data Science Presales Evangelist