Jak „mít pořádek“ v datech

I takhle by se dal shrnout cíl vzletně nazývaných disciplín jako Data Architecture a Data Management nebo Data Governance.

Pojďme si tyto termíny nejprve trochu přiblížit – Data Management kromě architektury a data governance zahrnuje například také tvorbu datové strategie podniku, bezpečnost dat, řízení kvality dat, datové sklady a datovou analytiku a další. Datová architektura je pak součást enterprise architektury, v některých pojetích je stavěna po bok IT architektury, jindy je chápána jako její podmnožina.

Data Governance představuje procesní a organizační zastřešení vybraných oblastí a využívá specifické nástroje – například pro správu metadatových úložišť. Po organizační stránce se pak projevuje tak, že uvnitř podniku někteří pracovníci mají roli tzv. datového stewarda, nebo jednoduše vlastníka konkrétních dat. Mezi vrcholovými manažery se pak může objevovat funkce se zkratkou např. DGO – Data Governance Officer nebo CDO – Chief Data Officer.

Mít pořádek v datech je docela nekonkrétní definice nějakého cíle. Lépe bychom tento cíl pojmenovali jako například zavedení plně kontrolovaného prostředí pro veškeré operace s daty v rámci organizace, které je ukotvené v interních směrnicích a je přirozeně navázané na všechny důležité prvky firemní architektury, jako jsou firemní procesy a organizační struktura. Po pravdě řešeno, výše uvedené může pro velkou řadu malých, středních ale i velkých firem znamenat určitou kulturní revoluci.

Takovou revoluci ale nelze tvořit zdola, musí mít v tomto případě naprostou podporu vedení, včetně dostatečného finančního zajištění. Určitou “výhodou” je, že důvodů, proč něco takového už nelze odkládat do budoucna, je řada regulatorních požadavků (a netýkají se jen ryze regulovaných odvětví, jako je např. bankovnictví) – prvním mezi nimi je GDPR – General Data Protection Regulation, která vstupuje v účinnost příští rok v květnu.

Co můžeme firmám, které si chtějí v blízké době přisvojit označení “data-driven organization” doporučit? Z našeho pohledu je, v rámci zavádění uvedených přístupů, potřeba začít dvěma body. Jednak je to vytvoření sdíleného celofiremního logického datového modelu (Enterprise Data Model). Za druhé potom zavedení striktně metadatového přístupu ve všech oblastech, kde se pracuje s daty a to ideálně ve zvoleném nástroji pro správu metadat.

Datový model organizace by měl vždy vycházet z obecnějšího obchodního modelu (Global Business Model). Zatímco obecný business model může mít lehce neformální podobu schémat a obrázků, Enterprise Data Model je už konkrétním, exaktním technickým řešením, které obsahuje úplný popis datových elementů uspořádaných typicky v relační struktuře (entity, atributy, relace). Je kompletně metadatově popsán ve zvoleném nástroji. Jeho nedílnou součástí je také referenční model, který obsahuje povolené kategorie hodnot (například seznam produktů v produktové hierarchii, seznam povolených stavů smluv) a jejich platné kombinace (např. aktivní klient musí mít alespoň jednu smlouvu ve stavu “otevřená”). Takový Enterprise Data Model je pak mj. základem většiny úloh řízení datové kvality.

Mimochodem, jako vhodná metodika pro vytváření Enterprise Data Modelů se jeví Data Vault, která je jinak propagována jako nástroj propojující světy datových skladů a velkých dat. Mimo jiné protože je připravená na přírůstkové změny a obsahuje princip, kdy opakováním jednoduchých prvků je možné vytvořit nebo popsat komplexní svět.

Data Vault Basics

What is “The Data Vault” and why do we need it?

Pokud jsme vás nestihli přesvědčit o potřebě mít jednotný datový model organizace promítnutý do všech dalších prvků firemní architektury, přidáme konkrétní důvod: regulace GDPR zavádí princip “one-stop shop”, kdy například své právo na opravu údajů uplatňujete na libovolné pobočce a správce má za povinnosti váš požadavek realizovat napříč celou organizací nebo holdingovou strukturou. Dokáže toto velká firma bez dat zmapovaných v jednotném modelu?

Petr Hájek