V business reportingu se často setkáváme se situací, kdy je požadavkem sledovat obdobný soubor ukazatelů nad různými kategoriemi. Na výstupu reportu tak dostáváme opakující se sadu sloupců, pouze nad odlišnými metrikami (případně dimenzemi). Následující text porovnává efektivitu a úskalí řešení v závislosti na (de)normalizované formě podkladové tabulky, přičemž v těchto výsledcích vycházím z dosavadních zkušeností získaných na projektu. Příklad z praxe Na ukázku uveďme zobecněný příklad …
Téma: Data
Společnost řízená daty
“In God we trust. All others must bring data.” — W. Edwards Deming Rozhodovat se na základě dat je rozumná myšlenka, kterou dnes už akceptuje převážná většina manažerů. Panuje také docela velká shoda o tom, co je k rozhodování řízenému daty v obchodních společnostech (firmách) potřeba. V první řadě musí být definován cíl, ke kterému rozhodnutí mají směřovat. Pak také musí existovat …
Datové projekty: Obstojí inženýrský přístup proti řízené evoluci?
Při budování podnikových řešení v oblasti data managementu, jako jsou metadatová úložiště, datové sklady, data lakes a podobně, se často setkáváme s požadavkem na uplatnění „agilního přístupu“ v kombinaci s garancí pevného rozsahu dodávky, pevného času a dodržení rozpočtu. Termín „agilní“ je v takových případech bezesporu používán nepřesně a zadavatel jím spíše označuje svoji představu, že „něco“ začneme dělat a budeme připravení „to“ všechno průběžně a kdykoliv libovolně měnit, a to včetně …
Data Vault 2.0 – dnešní pohled
Tento příspěvek není učebnice Data Vault modelování. Je to zamyšlení nad tím, k čemu je Data Vault metodologie dobrá a proč je dobré se o ni zase zajímat právě dnes. Na samém konci minulého století se objevily dva silné názory na strukturu datového skladu. Bill Inmon definoval základní principy datových skladů (Subject-oriented, Time-variant, Non-volatile, Integrated) a propagoval relační strukturu dat, Ralph Kimball postuloval principy …
Co je skutečná výzva v analýze sociálních vztahů?
Nejen v komunitě datových vědců je dnes dostatečně známo, že analýza sociálních vztahů, chápaná v nejširším smyslu slova, je mimořádně nosným zdrojem informací o chování a preferencích lidí. Vztahová data jsou široce využitelná pro prediktivní modelování, segmentace, scénářové predikce a mnoho dalších obchodních aplikací. Klíčovým faktorem sociálních sítí je spontánní vlastnost známá jako asortativita čili přirozená tendence uzlů v síti vytvářet spojení s takovými uzly, které sdílejí podobné …
Diplomová práce v rámci zaměstnání – dvě mouchy jednou ranou
Jak jsme již zmínili v předchozím blogu, v rámci naší dlouhodobé spolupráce s univerzitami studentům pomáháme i se závěrečnými pracemi a nabízíme jim reálné zkušenosti z našich projektů. Tak tomu bylo i v případě Šárky, kterou si vzal pod „svá křídla“ náš kolega Ondřej Zýka. Jako každého studenta před posledním ročníkem magisterského studia, i Šárku čekal výběr diplomové práce, jejíž tvorba je časově velmi náročná a není jednoduché ji skloubit …
MDM nebo DWH?
Posledních pár let jsem měl možnost být u několika projektů na vybudování datového skladu nebo jeho kompletní přestavbu. Jednalo se zpravidla o společnosti ve finančním sektoru. Týkalo se to jak vcelku malých společností, pro které bylo tohle téma zcela nové, tak i velkých mezinárodních organizací, které řešily vybudování řešení datových skladů na úrovni celé skupiny podniků. Jak už to u projektů bývá, očekávání – …
Pracovní snídaně: Metadatový sklad – další logický krok v řízení firemních dat
Rádi bychom vás pozvali na odbornou snídani věnovanou tématu řízení metadat. Metadata hrají čím dál důležitější roli v řízení firem. Roste jejich objem i složitost. Věříme, že principy datového skladu je s úspěchem možné aplikovat i na správu a využití metadat. Na odborné pracovní snídani vystoupí kromě našich konzultantů také zkušený informační architekt, který zprostředkuje zkušenosti z řízení metadat v několika komerčních bankách. Z obsahu: Typologie metadat, …
Co to je 3A systém
Když jsem probíral datové projekty, se kterými jsem se za dvacet let své kariéry setkal, došel jsem k zajímavému pozorování. Při pohledu ze správné výšky má většina z nich stejnou architekturu. Systémům s touto architekturou říkám 3A systémy. Základem každého 3A systému jsou fáze zpracování dat – datová architektura. Data vždy procházejí třemi základními vrstvami, v kterých jsou většinou i trvale uchovávána. První vrstva slouží k přejímání …
ClueMaker nabízí vizualizaci dat pro profesionály
Náš tým, který vyvíjí nástroj pro vizualizaci dat ClueMaker, letos nezahálel. Tento software pro vizuální analýzu dat prošel několika významnými aktualizacemi a stal se z něj dospělý produkt, který snese srovnání s daleko známějšími systémy, jako je například IBM i2 Analyst Notebook nebo řešení od Palantiru. ClueMaker je nástroj pro vizuální analytiku. Zajišťuje uživatelsky přívětivé dotazování napříč napojenými datovými zdroji a přehledné zobrazení výsledků, …