Dataři: Kdo jsme a jak už si nás mezi sebou neplést | Mňamka #526

Říkáme si dataři, protože děláme s daty. Tahle přezdívka je hojně využívaná, protože je to krátké, úderné a jednoduše to vystihuje naši práci s daty.  Ale jak říkával můj vysokoškolský profesor: ,,Pokud se to zdá příliš jednoduché, asi nejdeme dostatečně do hloubky věci” a to při oslovení dataře datařem opravdu nejdeme. Pokud bychom totiž k datařům přistupovali zodpovědně a chtěli zjistit, jestli se nějakým způsobem dělí, asi bychom narazili na roli datového inženýra, datového analytika a datového vědce (známého spíš jako data scientist). V téhle mňamce si tedy rozebereme jednotlivé role datařů v Business Intelligence a podíváme se na klíčové rozdíly mezi nimi. 

Datový inženýr (Data engineer)

Jak už název jeho pozice odpovídá je datový inženýr vlastně technicky zdatný odborník v datovém oboru. Je to přeci jenom inženýr. Datový inženýr je zodpovědný za vytvoření a správu datových toků. Tyto datové toky zajišťují přesun surových dat (raw data) do datových skladů a jejich přípravu pro další analýzu. Datový inženýr se ale byznysové analýze dat nevěnuje. Jeho práce zahrnuje návrh, vývoj a údržbu infrastruktury. Datový inženýr musí také zajistit, aby data byla bezpečně zpracována. Očekává se tedy od něj, že se také orientuje v bezpečnostních a právních předpisech.

Kdyby byl BI projekt dům, datový inženýr by se staral o to, že má stavba pevné základy či správně navrženou konstrukci. Také by musel vyřešit, zda jsou funkční všechny základní infrastruktury jako je voda, elektřina či kanalizace, aby byl dům obyvatelný.

Datový analytik (Data analytic)

Na rozdíl od datových inženýrů se datoví analytici více zaměřují na praktické využití dat v byznysu. Datový analytik se soustředí na zkoumání datových souvislostí a trendů za účelem poskytování informací, které podporují byznysová rozhodnutí. Datoví analytici spolupracují s byznysovými odděleními, aby pochopili jejich potřeby a otázky. Následně využívají data k nalezení odpovědí. Jejich hlavní zbraní pro naplnění tohoto cíle je komplexní dotazování do databází a jiných datových úložišť. Jestli něco umí dobře, tak přetavit surová data do užitečných a srozumitelných informací, které mohou být použity při strategickém rozhodování.

Zůstaneme u přirovnání BI k projektu domu, kdybychom měli při stavbě tohoto domu datového analytika byl by to pravděpodobně architekt interiéru. Tento architekt se zaměřuje na estetiku a funkčnost vnitřního prostoru domu. Musí tedy spolupracovat s majiteli domu, aby pochopil jejich potřeby a přání. Na základě toho navrhuje interiér, vybírá barvy, nábytek a dekorace. Jeho cílem je tedy vytvořit prostředí, které splňuje specifické požadavky a zvyšuje kvalitu života a pohodlí majitelů domu.

Datový vědec (Data scientist)

Vědec? To zní jako zkumavky a bílý plášť, ale stále se pohybujeme v datech a IT prostředí. Datový vědec kombinuje znalosti z oblasti strojového učení, umělé inteligence, pokročilých statistických metod, matematiky a programování. Jo, jestli hledáte dnes tak populární AI, tak tenhle odborník o tom bude pravděpodobně něco vědět. A u slova pravděpodobnost ještě zůstaneme, datový vědec je totiž pomocí těchto nástrojů schopen predikovat s určitou pravděpodobností složitější datové trendy a odkrývat skryté datové souvislosti. Datoví vědci se zaměřují na hlubší a pokročilejší analýzu dat než datoví analytici. Zatímco analytici se často soustředí na deskriptivní analýzu (tedy popisují současný stav firmy) datoví vědci využívají prediktivní a preskriptivní analýzu k předpovědím budoucích trendů a doporučování konkrétních akcí na základě datových modelů.

Dataři sobě

Teď když víme, jak se role datového inženýra, analytika a vědce liší, chápeme také, že je pro úspěch datových projektů klíčová jejich spolupráce. Takže BI projekty jsou prostorem pro všechny tyto typy datařů. Datový inženýr zajišťuje, že jsou data připravena v datových skladech, datový analytik z těchto dat vytváří byznysové analýzy a datový vědec pomocí pokročilých metod a algoritmů poskytuje prediktivní pohledy. Společně tak vytvářejí komplexní datový ekosystém! Tak co, už si nás nebudete mezi sebou plést?

Péťa Nedvědová
datový detektiv

LinkedIn