BigData – další vzestup zájmu nebo nenaplněná očekávání?

O tématice BigData toho již bylo v posledním roce či dvou napsáno mnoho a BigData se postupně stala jedním z mnoha zprofanovaných „buzzwords“. Jaká budoucnost tedy čeká „velká data“ v roce 2013?

Bohužel až příliš mnoho času strávila doposud celá data management komunita diskusí nad technickými aspekty konceptu BigData, příliš často se skloňovala témata jako Hadoop, Map&Reduce, data clusters, NoSQL a další. Vedly a vedou se diskuse, o kolik petabytes dat a jak nestrukturovaných se musí jednat, aby už bylo možné použít termín BigData. A to je škoda. Daleko zajímavější, revoluční a inovativní je diskuse, co konkrétně lze se všemi daty, která dnes organizace vlastní, dělat, jaká další data by organizace měla získat a zpracovávat – a především proč.

Dovolím si tvrdit, že každé téma je pouze tak zajímavé, jak zajímavý a důležitý je problém, který řeší. Z tohoto pohledu je k zamyšlení a diskusi aktuální 2012 Hype Cycle for Emerging Technologies od Gartnera (viz obrázek). Gartner tvrdí, že BigData čeká v příštím roce propad zájmu potenciálně doprovázený mírným zklamáním. Jiný pohled má na celou problematiku Forrester, který v září vydal aktuální Global Tech Market Outlook 2012 To 2013. Forrester mimo jiné predikuje 12% růst trhu v oblasti datových analytik, která je jednou z primárních aplikací konceptu BigData. Kdo má tedy pravdu?

Naše společnost se problematikou Data Managementu zabývá již více než 11 let a jsme pevně přesvědčení, že Gartner se mýlí a žádné ochladnutí zájmu této oblasti pro příští rok nehrozí. Spíše naopak. Navíc koncept BigData není ve skutečnosti nic revolučně nového, pouze se mu právě teď dostává velké a zasloužené pozornosti. O problematice velkého množství dat a informačním zahlcení se mluví a píše již od šedesátých a sedmdesátých let minulého století (kdo si pamatuje knihu Future Shock od Alvina Tofflera?). Stejně tak v akademické a vědecké komunitě existuje již mnoho let řada výzkumných skupin zaměřených na oblasti umělé a výpočetní inteligence, dataminingu nebo neuronových sítí. Nespornou výhodou naší doby je však existence pokročilých technologií, které zpracování velkého objemu často nestrukturovaných dat umožňují.

Co nás tedy čeká v roce 2013? Pevně věřím, že namísto ztráty iluzí bude pokračovat intenzivní debata o využití „velkých dat“. Potenciálu je mnoho a pozitivních příkladů také. Jedním z mnoha může být např. Anti Fraud Solution – řešení, které Profinit implementoval pro velkou finanční společnost v České republice, a jehož součástí je i sofistikovaná a komplexní analytika chování klientů společnosti, zaměstnanců a dalších souvisejících subjektů, s cílem detekovat známé i dosud neobjevené rysy podvodného chování. Velkou příležitostí je pak doména Customer Intelligence. Pokud se společnostem podaří využít velké množství dat, kterými již dnes často disponují, pro lepší pochopení potřeb svých zákazníků a k přesnější predikci jejich chování, bude výsledkem lepší nabídka služeb, vyšší zákaznická spokojenost a efektivnější prodej.

Na cestě k efektivnímu využití „velkých dat“ na nás však čeká několik podstatných překážek, ale o tom příště.