Self service BI aneb "naklikat to zvládnu sám" | Mňamka #234

Představte si to. Právě jste zjistili, že by vám vlastně pomohlo, kdybyste trochu víc pracovali s daty. Jenže co teď? Stavět datový sklad? Nakoupit servery? Ale ne … v dnešní době spíš jít a zaregistrovat se do Snowflake nebo Google BigQuery. Jenže, tohle je jen začátek. Mysleli jste si, že koupí té nové výkonné cool databáze to končí? Ale kdeže. To je vážně jen začátek. Celé datové řešení totiž není jen o výběru vhodného nástroje… je to mnohem komplexnější.

Musíte se rozhodnout, jestli budete stavět analytiku svépomocí. Nebo ne. Stavět analytiku / datové řešení svépomocí bych přirovnal ke stavbě domu. Asi to uděláte, ale připravte se na to, že to bude skřípat. Pravděpodobně ztratíte hodně času, budete řešit už dávno vyřešené a občas budete možná vynalézat kolo. 

Zajímavě o tom psali GoodData v “buy vs. build”. Když jsem se nad tím zamyslel, co bych poradil někomu, kdo chce stavět “self service BI”, napadlo mě několik variant řešení:

Varianta 1 - Koupíte si Snowflake, BigQuery nebo něco podobného jako databázi a k tomu třeba Tableau nebo GoodData. Zavřete se na celou zimu do sklepa a začnete drtit SQL, jak dostat data do databáze, jak je dostat ven, co a jak s nimi dělat atd. atd. No, možná byste v tom sklepě zůstali pár let… Takže pokud nemáte alespoň nějaké zkušenosti, asi se víc vyplatí soustředit se na svůj business a tuhle věc předat někomu jinému. Za mě tohle není cesta.

Varianta 2 - Najmete někoho, aby “vám ten nástroj nainstaloval”, ale ty reporty už si naklikáte sami. Self service. Easy. Ikea style. No jo… jenže dost možná zase zjistíte, že sice něco si naklikat zvládnete, ale tu je potřeba něco přepočítat, upravit, přemodelovat. Prostě jako když si přivezete kuchyň z IKEA a potřebujete to celé tak nějak dořezat, aby pasovala mezi ty ne uplně rovné stěny, podlahu, ... Boj.

Varianta 3 - Najmu si někoho kdo mi postaví interně celé řešení. To zvládne jeden člověk přece. Bude to levnější než najímat nějakou firmu “na klíč” … jo asi jo. Může to zvládnout. Pokud ho vyberete dobře, je to možné řešení. Nicméně ten člověk bude mít někdy dovolenou, někdy bude nemocný a pak taky třeba odejde a nechá nezdokumentované řešení, které “nějak udělal”, ale nikdo ho neumí ovládat. Jó pár takových už jsem viděl… Riziko.

Varianta 4 - Excel mi stačí. Tohle je samozřejmě s nadsázkou. No prostě čistá kapitulace. Zůstanete u Excelu :)

A pozor. Tím, že datové řešení postavíte, to zase nekončí. Odpovědi na otázky generují další otázky a tak pořád dokola. Je to vlastně nikdy nekončící proces vývoje, učení, testování. Ten se jednoho dne určitě vyplatí mít “pod svojí střechou”, ale do té doby… je to na zvážení.

V dnešní době existuje určitě hodně nástrojů, které jsou tzv. “self service”. Nicméně, jak jsem psal na začátku, celé to zdaleka není jen o tom nástroji...

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Jirka Tobolka
datový detektiv
LinkedIn

Tableau - Performance Tuning (časť 3.) | Mňamka #506

Tableau - Performance Tuning (časť 3.) | Mňamka #506

Chcete vědět, jak zlepšit rychlost a efektivitu vašeho dashboardu v Tableau? Tento článek vás seznámí s významem materializace výpočtů, výhodami agregace dat a důležitostí specifikace datových zdrojů. Navíc se dozvíte o nové funkci "workbook optimizer", která vám nabídne automatizované doporučení pro dosažení optimálního výkonu vašeho dashboardu. Přečtěte si více a dozvíte se, jak dosáhnout rychlejšího a hladšího provozu vašich vizualizací v Tableau.

Tableau - Performance Tuning (časť 2.) | Mňamka #503

Tableau - Performance Tuning (časť 2.) | Mňamka #503

Dnes nadviažeme pokračovaním na minulotýžďnový článok a pozrieme na niektoré ďalšie možnosti zrýchlenia vašeho pomalého dashboardu. V prípade filtrov tiež platí, že pre performance je lepšie držať ich počet na uzde. Je to spôsobené tým, že načítanie hodnôt pre každý jeden interaktívny filter predstavuje jednu query. Negatívny vplyv na performance sa ešte umocňuje v prípade využitia možnosti “Only Relevant Values”.

Tableau - Performance Tuning (časť 1.) | Mňamka #500

Tableau - Performance Tuning (časť 1.) | Mňamka #500

Naimplementovali ste dashboard, vyhrali ste sa s vizuálom, čísla na vám sedia. Násadíte dashboard na Tableau server a idete ho otestovať, tu však narazíte na problém. Dashboard sa načítava extrémne dlho. Pre časovo vyťažený klienta, ktorý potrebuje mať dáta nie len správne, ale aj dostupné v rozumnom čase, je samozrejme takýto stav neakceptovateľný. Čo teraz? Určite nezúfajte, v tomto článku sa s vami podelíme o skúsenosti čo v takom prípade robiť.