Stane se Data Science plně automatizovanou?

Autor blogu je Data Scientist a svou práci miluje. Takže jakmile roboti i tuto oblast lidské činnosti převezmou, nejspíš přijde o svou práci a stráví zbytek života v depresi nad svou neschopností. Nebo tomu bude jinak?

Přestaňme chodit kolem horké kaše a podívejme se zpět na uplynulá desetiletí a staletí – každá výdělečná lidská činnost byla zautomatizována. Existují samořiditelná auta a na burzách spolu také obchodují stroje. A můžeme jít i k činnostem, které byly vyřešeny daleko dříve: doma si už chleba nepečeme, ale kupujeme ho od velkovýrobců; mléko a vajíčka jsou doslova dolována ze zvířat v obrovských průmyslových halách (ok, tohle je eticky problematické, ale asi chápete, kam tím mířím). Zkrátka – stroje již před desítkami let nahradily lidskou práci a tento proces nadále pokračuje.

Data jsou nazývána „ropou 21. století“, jsou nezbytnou složkou každého byznysu. Chcete-li však své na datech založené rozhodovací mašinérie roztočit, je třeba v první řadě porozumět samotným datům – vydestilovat z nich kýženou informaci, která pak znamená konkurenční výhodu. Poptávka po automatizované datové rafinérii (neboť ta má mnohem větší kapacitu než manuální destilace) je tedy obrovská. Otázka v úvodu by tedy neměla znít „ZDALI“, ale spíše „KDY“ se Data Science stane automatizovanou? *)

*) Ano, záměrně zde vynechávám „plně“ automatizovanou – přeci jen je Data science věda a jako věda je poháněná neutuchající zvědavostí svých dělníků. Dokud tedy nevyvineme stroje zvědavé jako malé děti, rozhodně nedobyjí všechny končiny Data science. Ty nejrozšířenější však rozhodně ano.

Vypadá to docela depresivně, že? Měli bychom tedy vzít spravedlnost (a několik pochodní) do vlastních rukou a zničit ty zlé stroje, dokud máme šanci?

Ne, nemyslím si, že budoucnost bude zlá. Ba právě naopak! Automatizace Data Science přinese minimálně tyto tři úžasné změny (vedle vyššího HDP, pokročilejších technologií a větší konkurenceschopnosti našich firem):

1. Demokratizace Data Science

Je to proces, který již probíhá (viz např. tento článek na blogu MIT). Už nebude třeba zabývat se Data Science na plný úvazek, abyste porozuměli svým datům. Dokáže to kdokoliv! Zejména odborníci na danou oblast tak budou mít v rukou mocné nástroje umožňující ještě větší expertizu.

Druhý aspekt tohoto bodu je pro Data Scientisty ještě slibnější: jakmile bude velká část společnosti denně čelit úkolům souvisejícím s daty, bude tlak na jejich dostupnost a kvalitu ještě větší. To zapříčiní dostupnost a hlavně rozsáhlejší využívání datových zdrojů v mnoha oblastech.

2. Snadná příprava dat

Pracovali jste někdy na Data Science projektu? (Mimochodem, u nás v Profinitu je časem prověřený standard CRISP-DM.) Pak jste pravděpodobně strávili spoustu času přípravou dat. Podle některých studií stráví Data scientisté až 80 %svého času přípravou a čištěním dat, namísto práce na skutečných obchodních problémech. A co si budeme povídat, takové čištění dat … no, zpravidla není úplně zábavné. A vzhledem k tomu, že stroje mohou takové úsilí hravě zvládnout, pojďme jim tuto práci přenechat…

3. Lepší rozhodnutí založená na faktických datech

Tento bod je možná tak trochu utopie, ale stejně věřím v lepší společnost založenou na faktech a datech. Ve společnost, která není tak závislá na názoru jednoho vůdce nebo tak jednoduše manipulovatelná bezmyšlenkovitým papouškováním polopravd. Skvělým příkladem aplikace Data Science přístupů v této oblasti je tzv. Datová žurnalistika, která v současné době nabývá na významu a oblibě po celém světě. (Zde nemohu nezmínit jeden z našich produktů, ClueMaker, jenž datovým novinářům pomáhá rozkrývat třeba pochybné vazby lobbistů na politiky.)

Pravděpodobně si dokážete představit i další řadu výhod, které přináší automatizace Data Science (napište je prosím do komentářů – rád si je přečtu!). Pro mne jakožto datového vědce je nejslibnější z nich tato: jakmile se Data Science stane běžnější a široce využívanou, stroji i lidmi, její působnost se začne nadále rozšiřovat. A až si stroje převezmou tu repetitivní a málo zajímavou část, budeme se moci věnovat zajímavějším problémům a posouvat tak hranice možného ještě dál. A na to se opravdu těším :).