Když jsem probíral datové projekty, se kterými jsem se za dvacet let své kariéry setkal, došel jsem k zajímavému pozorování. Při pohledu ze správné výšky má většina z nich stejnou architekturu. Systémům s touto architekturou říkám 3A systémy.
Základem každého 3A systému jsou fáze zpracování dat – datová architektura. Data vždy procházejí třemi základními vrstvami, v kterých jsou většinou i trvale uchovávána.
- První vrstva slouží k přejímání dat. Je zodpovědná za to, že systém je schopen data získat. Vrstva často slouží jako archiv vstupů, který umožňuje analyzovat další zpracování, a také prokázat kdo, kdy a v jaké kvalitě data dodal. Někdy se na této úrovni řeší úprava dat pro potřeby dalšího zpracování a podpora případů, kdy získaná data zpracování nevyhovují.
- Druhá vrstva zodpovídá za vlastní zpracování dat. Mění se zde struktura dat, data se integrují, obohacují se o výsledky výpočtů, porovnávají se a kombinují se s již uloženými daty, provádí se historizace, mění se jejich granularita.
- Třetí vrstva slouží hlavně pro publikaci výsledků. Data se zde upravují do struktury srozumitelné jednotlivým uživatelům. Většinou se na této vrstvě řeší také bezpečnost, aby každý uživatel dostal jenom to, co chce a na co má právo.
Název 3A systémy vychází z uvedeného přístupu k datům: Acquire data, Adopt data and make data Accessible.
Důležité je, že všechny 3A systémy mají ještě dva hlavní rysy. K datové statické části architektury patří i dynamická část. Ta popisuje způsob získávání dat, přechody dat mezi jednotlivými vrstvami a jejich úpravy, a také způsob předávání dat a výsledků uživatelům. V 3A systému se jednotným způsobem transformace vytvářejí a spouštějí, systém vždy obsahuje nějaký plánovač. V této oblasti se jednotlivé systémy hodně liší, zejména v míře automatizace a rozsahu možných uživatelských zásahů během zpracování.
Poslední rozpoznávacím rysem 3A systému, je „jednotné“ řízení. Každý 3A systém má jasně definovanou nějakou řídící strukturu nebo osobu. Ta je zodpovědná za to, že systém dělá „to co má“. Tedy definuje výstupy systému, řídí zpracování a je zodpovědná za datovou kvalitu výstupů.
Tento popis hodně připomíná třívrstvou architekturu datového skladu. Je to tak. Datový sklad je typickým příkladem 3A systému. Ale zdaleka není jediným. Může se jednat i o mnoho jiných typů systémů nebo projektů:
- Reportovací systémy – systémy pro vytváření reportů pro konkrétního důležitého odběratele – regulatorní reporting, reporty pro mateřskou společnost a podobně
- Analytické systémy jednotlivých oddělení: bezpečnost, marketing, controlling,…
- Ad-hoc řešení pro data science nebo pro jednorázové analýzy
- Některé agendové systémy zpracovávající agendy automaticky nebo semiautomatickz: například účtovací systémy nebo systémy pro automatický sběr dat z čidel a jejich agregaci.
- Mikroagendy – rozšíření ERP systémů o aplikace v Excelu, Accessu, PowerBuilderu nebo jiném nástroji, které si vytahují data ze systémů, umožňují uživatelům jejich specifické zpracování a zpracovaní data vrací zpět.
- Projekty datové migrace, kdy se během vývoje v mnoha kolech přebírají data z původních systémů, transformují se a loadují do nového řešení.
- Jakékoliv sofistikovanější použití Excelů má charakter 3A systému a řeší všechny uvedené body architektury.
- Archivační systémy a archivace dat z odstavených systémů
- Datový sklad – chápaný jako jednotný systém pro správu agregovaných celofiremních dat (jednotné pravdy).
- Některé data marty v datovém skladu samy o sobě mají charakter 3A systému – data mart pro analýzu produktivity, finanční reporting nebo obchodní reporting. Zejména se jedná o data marty, které mají jiný časový režim zpracování, než samotný datový sklad.
- V samotném datovém skladu mohou existovat oblasti pod správou a provozováním specializovaného vlastníka. Ty sami o sobě mají také často charakteristiku samostatných 3A systémů, přestože jejich výsledky jsou součástí datového skladu. (MIS řešení, Výpočet profitability, Výpočet interní marže a podobně).
Proč je vlastně vymezení 3A systémů zajímavé. Je to zejména proto, že u každého takového systému se řeší stejné problémy a úspěch řešení ovlivňuje rozhodnutí na stejné otázky. A zatímco někdy je hned na začátku jasné, na co je nutné se soustředit, někdy se stejná problematika řeší v mnoha krocích na základě pokusů a omylů. A které jsou základní otázky 3A systémů a tak vůbec? Seznam 42 základních bodů k rozhodnutí najdete v příštím článku.