Společnost řízená daty

 

“In God we trust. All others must bring data.” — W. Edwards Deming

 

Rozhodovat se na základě dat je rozumná myšlenka, kterou dnes už akceptuje převážná většina manažerů. Panuje také docela velká shoda o tom, co je k rozhodování řízenému daty v obchodních společnostech (firmách) potřeba. V první řadě musí být definován cíl, ke kterému rozhodnutí mají směřovat. Pak také musí existovat relevantní data použitelná k rozhodování a tato data musí mít potřebnou kvalitu.

Tento příspěvek se však netýká společností obchodních – těm nadále důsledně budu říkat firmy. Týká se rozhodování v široké společnosti, kterou lze chápat jako množinu sdružení, spolků, neformálních komunit a veřejnosti obecně. Zde je situace úplně jiná. Přesto je rozhodování na základě dat v tomto případě nejlepší volba. Jedná se o výrazně lepší přístup než rozhodování na základě ideologií, zvyků nebo názoru nejprůbojnějších jedinců.

Základní rozdíl oproti firemnímu prostředí je v definici cílů. Zatímco ve firmách cíle určuje vedení, ve společnosti mají různé skupiny různé cíle (často diametrálně odlišné) a najednou probíhá celá řada rozhodnutí v mnoha směrech. A právě pro podporu těchto rozhodnutí je dobré využít data.

Potřebujeme spoustu dat. A spoustu použitelných a užitečných dat máme také k dispozici. Dokonce si jejich vytvoření a správu veřejnost platí. Jsou to data, která spravuje stát, státní instituce, orgány státní správy a příspěvkové organizace placené ze státního rozpočtu.

První otázka zní, jak se o existenci dat dozvědět? A hned následující otázkou je, jak se k datům dostat?

Odpověď na první otázku je podle mě jednoduchá. Je prostě základní slušnost, že pokud vytvářím data za veřejné peníze, tak o tom veřejnost informuji. Technicky to znamená publikovat meta data o všech shromažďovaných datech.

Složitější otázkou je, jak je to s publikací samotných dat. Jsem přesvědčen, že pokud se nejedná o data ohrožující národní bezpečnost, měla by se publikovat v takové formě, aby vyhovovala zákonům a předpisům, jako je zákon o ochraně osobních údajů, směrnici GDPR a podobně. Toho se dá dosáhnout anonymizací a agregací publikovaných dat. Sice zde budou pořád spory o míře anonymizace a o tom, kdy dát přednost ochraně osobních dat a kdy veřejnému zájmu, to ale není důvod, proč data nepublikovat.

S problematikou publikování dat jsou spojené dva mýty.

Mýtus první – skrýváním dat se bráníme jejich zneužití. Tento mýtus vychází z naivní představy vlastníků dat, že jsou schopni zabránit jejich zneužití. To je ovšem iluze. Jakákoli existující data lze zneužít. Ti zlí vždycky najdou způsob, jak se k datům dostat, pokud se jim to z finančního či jiného hlediska vyplatí. Naopak se k nim nedostanou ti, co si jejich vznik zaplatili a mohli by z jejich zveřejnění čerpat.

Druhý mýtus je, že organizace musí nakládat s daty s péčí řádného hospodáře, což brání jejich publikování. Ano, data jsou majetek a mají svou hodnotu. Ale maximální hodnotu získají data tím, že je budou moci využívat všichni. To je veliký rozdíl oproti firmám. Tam zákon o obchodních korporacích říká mimo jiné to, že jednat s péčí řádného hospodáře znamená „jednat v obhajitelném zájmu obchodní korporace“. Ale pokud vím, státní organizace ani příspěvkové organizace zatím nejsou obchodní organizace, na které by se vztahoval zákon o obchodních korporacích.

Poslední předpoklad pro řízení na základě dat zmíněný v úvodu je potřebná datová kvalita dat, podle kterých se rozhodujeme.

Co to je datová kvalita? Datová kvalita je velice subjektivní pojem. Neexistuje nic jako technická specifikace kvalitních dat. Data jsou kvalitní, pokud jsou dostatečná pro potřeby jejich uživatelů.

Ve firmách je to jednoduché, protože je dobře definováno, k čemu data mají sloužit. Firmy investují extrémně vysoké částky, aby získaly a udržely data v kvalitě potřebné pro své rozhodování. Budují proto speciální systémy (datové sklady) a enormně investují do aplikací pro čištění a integraci dat. A protože firmy vědí, k čemu data mají sloužit, jsou schopné investovat do datové kvality efektivně.

Ve společnosti je to jiné. Samozřejmě předpokládám, že správci dat udržují data v takové kvalitě, aby odpovídala důvodům jejich vytváření. Nicméně přežívá mýtus, že existuje něco jako kvalitní data. Správci se někdy snaží vytvořit data, s kterými by byli spokojeni všichni. Ale protože definice kvality dat je subjektivní a protože ve společnosti je mnoho subjektů, je tento úkol nesplnitelný.

V jakýchkoliv publikovaných datech jste schopni identifikovat nesrovnalosti, často mylně nazývané chybami v datech. S tím je nutné se smířit. To, co může zvýšit kvalitu dat v takové situaci, jsou zase jenom meta data. Informace o tom, jak data vznikají, jak se zpracovávají, kdo a jak data upravuje a integruje, kdo je za ně zodpovědný, jakým podmínkám vyhovují. Tím se zvyšuje kvalita dat – přinejmenším pokud jde o jejich důvěryhodnost. Každý uživatel se může na základě těchto informací rozhodnout, do jaké míry jsou data relevantní a použitelná pro jeho rozhodnutí.

Shrnutí je jednoduché: Pokud chceme mít co nejlepší rozhodování na všech úrovních společnosti, a já věřím, že to všichni chceme, potřebujeme data… všechna data. Čím více o nich budeme vědět, tím budou pro rozhodování užitečnější. Na druhé straně se musíme smířit s tím, že získaná data nikdy nebudou perfektní.

Na závěr si neodpustím jedno aktuální přání. Finanční firmy jsou svázány silnými regulacemi – například regulací BASEL pro bankovní sektor nebo Solvency pro pojišťovny. Tyto regulace mimo jiné striktně popisují požadavky na publikování dat a požadavky na jejich kvalitu. Tyto regulace vznikly v reakci na finanční a bankovní krize. Doufejme, že covidová krize a zkušenosti s rozhodováním v této krizi povedou ke zlepšení přístupu veřejnosti k datům a k tomu, že společnost jako celek bude schopna se na základě dat lépe rozhodovat.

 

Autor: Ondřej Zýka

Data a informace je bohatství, o které je potřeba pořádně pečovat. RNDr. Ondřej Zýka prosazuje tuto myšlenku přes patnáct let z pozice Information Management Principal Consultant ve firmě Profinit, řídí se jí v projektech vývoje datových skladů, zlepšení Datové kvality, správy Metadat, nasazení Master Data Managementu. A je to také jedním z témat jeho přednášek na vysokých školách, kde přednáší o databázových systémech.