Self service BI aneb "naklikat to zvládnu sám" | Mňamka #234
Představte si to. Právě jste zjistili, že by vám vlastně pomohlo, kdybyste trochu víc pracovali s daty. Jenže co teď? Stavět datový sklad? Nakoupit servery? Ale ne … v dnešní době spíš jít a zaregistrovat se do Snowflake nebo Google BigQuery. Jenže, tohle je jen začátek. Mysleli jste si, že koupí té nové výkonné cool databáze to končí? Ale kdeže. To je vážně jen začátek. Celé datové řešení totiž není jen o výběru vhodného nástroje… je to mnohem komplexnější.
Musíte se rozhodnout, jestli budete stavět analytiku svépomocí. Nebo ne. Stavět analytiku / datové řešení svépomocí bych přirovnal ke stavbě domu. Asi to uděláte, ale připravte se na to, že to bude skřípat. Pravděpodobně ztratíte hodně času, budete řešit už dávno vyřešené a občas budete možná vynalézat kolo.
Zajímavě o tom psali GoodData v “buy vs. build”. Když jsem se nad tím zamyslel, co bych poradil někomu, kdo chce stavět “self service BI”, napadlo mě několik variant řešení:
Varianta 1 - Koupíte si Snowflake, BigQuery nebo něco podobného jako databázi a k tomu třeba Tableau nebo GoodData. Zavřete se na celou zimu do sklepa a začnete drtit SQL, jak dostat data do databáze, jak je dostat ven, co a jak s nimi dělat atd. atd. No, možná byste v tom sklepě zůstali pár let… Takže pokud nemáte alespoň nějaké zkušenosti, asi se víc vyplatí soustředit se na svůj business a tuhle věc předat někomu jinému. Za mě tohle není cesta.
Varianta 2 - Najmete někoho, aby “vám ten nástroj nainstaloval”, ale ty reporty už si naklikáte sami. Self service. Easy. Ikea style. No jo… jenže dost možná zase zjistíte, že sice něco si naklikat zvládnete, ale tu je potřeba něco přepočítat, upravit, přemodelovat. Prostě jako když si přivezete kuchyň z IKEA a potřebujete to celé tak nějak dořezat, aby pasovala mezi ty ne uplně rovné stěny, podlahu, ... Boj.
Varianta 3 - Najmu si někoho kdo mi postaví interně celé řešení. To zvládne jeden člověk přece. Bude to levnější než najímat nějakou firmu “na klíč” … jo asi jo. Může to zvládnout. Pokud ho vyberete dobře, je to možné řešení. Nicméně ten člověk bude mít někdy dovolenou, někdy bude nemocný a pak taky třeba odejde a nechá nezdokumentované řešení, které “nějak udělal”, ale nikdo ho neumí ovládat. Jó pár takových už jsem viděl… Riziko.
Varianta 4 - Excel mi stačí. Tohle je samozřejmě s nadsázkou. No prostě čistá kapitulace. Zůstanete u Excelu :)
A pozor. Tím, že datové řešení postavíte, to zase nekončí. Odpovědi na otázky generují další otázky a tak pořád dokola. Je to vlastně nikdy nekončící proces vývoje, učení, testování. Ten se jednoho dne určitě vyplatí mít “pod svojí střechou”, ale do té doby… je to na zvážení.
V dnešní době existuje určitě hodně nástrojů, které jsou tzv. “self service”. Nicméně, jak jsem psal na začátku, celé to zdaleka není jen o tom nástroji...
Pandas – k čemu slouží, k čemu jej raději nepoužijeme a jeho alternativy | Mňamka #435
Pandas je jednou z nejpoužívanějších knihoven pro zpracování dat v jazyce Python. Jeho největší předností je zejména jednoduchá a intuitivní syntaxe a také rychlost, se kterou můžete zpracovávat velké datové soubory. V BizzTreatu ho proto často využíváme např. pro ad hoc analýzy dat, kdy potřebujeme rychle prozkoumat, jak data vlastně vypadají a jaká je jejich kvalita. V dnešní mňamce od Báry si ukážeme, kde všude lze Pandas použít a jak si stojí v porovnání s ostatními knihovnami!
Keboola transformace – v hlavní roli proměnné | Mňamka #432
Co dělat, když se váš projekt liší jen v několika důležitých parametrech? No mohli byste samozřejmě všechno hardkódovat, to je ale značně pracné. V BizzTreatu proto raději dáváme přednost hojnému využívání proměnných. Jednak se s nimi lépe pracuje a zároveň nám usnadňují následnou správu kódu. V Keboola transformacích přitom máme hned dva typy proměnných – ty keboolácké a ty snowflakové. V dnešní mňamce od Kristýny si ukážeme, jaký je mezi nimi rozdíl a kdy a jak je používat!
MAQL I. - MAQL vs SQL | Mňamka #427
SQL dozajista velmi dobře znáte, jak jste na tom ale s takovým MAQL? Pokud si chcete rozšířit obzory o další dotazovací jazyk, tak to jste na správném místě. MAQL je uživatelsky přívětivý jazyk, se kterým se můžete setkat při práci v GoodData, a naše Péťa si o něm připravila krátkou minisérii. A hned v prvním díle tu máme malé srovnání pro všechny zaryté fanoušky SQLka. Ukážeme si totiž, k čemu vám může být MAQL užitečný a kolik práce vám díky předdefinovaným operacím ušetří. Tak pojďme na to!