Strojové učení bez blackboxů

black boxV dnešní době jsme svědky demokratizace strojového učení. Díky nárůstu výpočetního výkonu a dostupnosti moderních machine-learningových frameworků zvládne sestrojit třeba neuronovou síť téměř každý.

Od našich zákazníků ale často slýcháváme, že blackbox řešení jsou sice pěkná, ale nepřijatelná. Navíc je může zakazovat platná legislativa. Vyvstává proto otázka – má vaše Data Science oddělení ve svém „arzenálu“ adekvátní alternativy?

My v Profinitu samozřejmě ano! A právě v tomto článku bych se chtěl věnovat jedné z nich. Jsou jí tzv. Bayesovské sítě – snadno interpretovatelné a neméně fascinující než jejich neuronové jmenovkyně.

Je model černé skříňky pro vás vhodný?

Poněkud zjednodušená verze Moorova zákona říká, že výpočetní výkon počítačů roste exponenciálně. Nárůst výkonu umožňuje značný rozvoj i v oblasti Data Science. To, co se statistikům před 30 lety zdálo neupočítatelné, lze dnes zpracovat na běžném notebooku během několika sekund.

Masivní rozvoj výpočetní techniky také umožňuje vyvíjet stále sofistikovanější modely strojového učení. A nemluvím jen o hlubokých neuronových sítích. V prediktivním modelování jsou velmi oblíbené například tzv. ansámblové modely – modely sestrojené vhodným kombinováním submodelů, jež mohou být samy o sobě velmi složité.

Než se ale někdo takový ML nástroj rozhodne použít v praxi, měl by si položit alespoň tyto tři zásadní otázky:

  • Máme k dispozici velké množství kvalitních historických dat?
  • Disponujeme dostatečným výpočetním výkonem, abychom byli schopni tato data zpracovat (jak jsme již předeslali, toto zpravidla nebývá nejpalčivější problém)?
  • Jsme ochotni zaplatit interpretabilitou modelu?

Poslední otázka ukazuje na známou skutečnost: komplexní ML nástroje jsou v podstatě blackboxy. Z takových modelů je velmi obtížné až nemožné vypreparovat kauzální větu:

Protože klient udělal X, model mu přiřadil hodnotu Y. Firmám pak nezbývá než věřit, že je uvnitř vše správně poskládáno.

Model bílé skřínky

Prosím, nechápejte mne špatně, nijak nezpochybňuji užitečnost moderních ML frameworků. Právě naopak – z odborného hlediska jsou skutečně fascinující! A pokud mi dáte problém, kterému jsou šité na míru, tuze rád navrhnu a sestrojím vysoce výkonné řešení.

Je však třeba si uvědomit, že zdaleka nejsou řešením každého problému. Ba, dle mé dosavadní zkušenosti, jsou takové problémy v menšině, především v bankovním světě.

V oblasti financí a bankovnictví je navíc blackbox přístup často nepřípustný. Vezměme si jen otázku diskriminace – můžeme si být jistí, že náš všespásný model neznevýhodňuje některou skupinu klientů? Pro příklady nemusíme chodit daleko – článků o tom, jak něčí AI znevýhodňuje třeba lidi tmavé pleti, je spousta…

Je proto nezbytné mít ve svém Data Science toolboxu i modely z druhé škatulky, označované jako „white-box“ nástroje. Pojmenování „white-box“ možná není úplně nejšťastnější. Lépe by této třídě ML modelů slušelo označení „transparent-box“, vždyť jejich klíčovou výhodou je možnost podívat se algoritmu tak říkajíc pod prsty.

Spadají sem samozřejmě řešení, s nimiž přišli statistici v dobách, kdy byla éra počítačů ještě v plenkách. Chtě-nechtě to musel být člověk, který prováděl výpočet; o blackbox modelu tak nemohla být řeč.

Ale netřeba se omezovat na klasické regresní modely a rozhodovací stromy, kterým bývá vyčítáno, že ve srovnání s moderními přístupy tak trochu ztrácí dech. Existují i modernější nástroje.

Bayesovské sítě – náhrada za blackbox ML?

A tady se vracíme k Bayesovským sítím, které jsme „naťukli“ v úvodu článku. Přijdou vhod všude tam, kde je vedle výkonnosti kladen důraz na interpretabilitu výsledků. Patřičně totiž reagují na všechny 3 výše uvedené otázky:

  • S jejich konstrukcí lze začít nad řádově menší trénovací množinou. Navíc komplexitu sítě lze regulovat a s přibývajícími vzorky ji lze zvyšovat.
  • Učení Bayesovské sítě je velmi snadné. Když předběhnu, stačí vyhodnotit přínos jednotlivých uzlů sítě a tyto hodnoty dát dohromady.
  • Výstup z Bayesovské sítě je snadno interpretovatelný. Každé rozhodnutí modelu lze vysledovat a zkontrolovat.

A co vy, už jste někdy slyšeli o Bayesovských sítích? Ve světě Data Science to není žádná novinka. Profesor Judea Pearl s nimi přišel před víc než 30 lety a sítě si získaly reputaci v různých oborech, např. v medicíně nebo ve forenzních vědách. Tak proč je neaplikovat i v doméně, která je nám nejblíž – ve financích a bankovnictví?

Bayesovským sítím bývá vyčítáno, že jejich konstrukce je složitá. Není tomu tak. V dalším článku si ukážeme, že k bayesovskému uvažování stačí základní matematika.  Ke konstrukci Bayesovské sítě je pak už jen krůček. Tak zůstaňte s námi!

 

Autor: Dominik Matula

Data Science Consultant