Tak co teda? Tableau, Power BI nebo GoodData?

Taky stojíte před rozhodnutím, jaký vizualizační nástroj používat? Naše mnohaletá zkušenost je jednoznačná. Není žádný nejlepší tool, který pokryje všechny use cases. Prostě na daný úkol je třeba použít správné kladivo.

V našich projektech vybíráme ze třech nástrojů - Tableau, Power BI a GoodData. Tady máte náš pohled, kdy volíme jaký z nich, vč. tabulkového porovnání jejich vlastností. V žádném případě se nejedná o vyčerpávající přehled, spíš shrnutí, co nám ve výběru přijde důležité.

Tableau

Jeden ze dvou leaderů současnosti - aspoň podle Gartneru. Už vidím, jak se do mě teď někteří z vás pustí, že jsem nevyzdvihl některou oblíbenou vlastnost. Tableau je ultra super nástroj pro ad-hoc analýzu. Možnosti připojení velkého množství datových zdrojů, možnosti je různě kombinovat od cross-database joins, přes blending až po nové relationships, téměř neomezené možnosti nastavení vizualizací - stačí se jen inspirovat v Tableau Public komunitě. Silný skriptovací jazyk na definici odvozených metrik a dimenzí (tzv. calculations).

Máte - relativně malý - tým analytiků, jejichž denním chlebem je ad-hod analýza napříč heterogenními datovými zdroji? Velké (obří) objemy dat? Pak Tableau je tool pro vás. Efektivita práce je obrovská. Znám fůru analytiků, kteří sedí s otevřeným Tableau Desktopem na poradě vedení a v reálném čase odpovídají na zvídavé otázky, vč. jednoduchých forecastů apod. Super!

Tableau má i super prostředí pro sdílení datových zdrojů, jednotlivých analýz a reportů a vůbec nastavení celého procesu data governance. Snadno se integruje do prostředí jakékoli firmy. Co je nepříjemný je cena, takže pokud počítáte uživatele ve stovkách a navíc většina z nich se chce “jenom dívat” na dashboardy, které jste jim vytvořili, vyjde vás Tableau poměrně draho. Někdy až velmi draho.

Power BI

Milované (Gartnerem a Microsoftily)  i nenáviděné Power BI. Nejmladší ze zmiňovaných zástupců. Na první pohled to skoro vypadá, ze Microsoft od Tableau hodně opisoval, akorát toolbox dal vpravo místo vlevo:-) Na druhý pohled jsou rozdíly zřetelné.

Tool s obrovskýma ambicema. Kromě všeho, co zmiňuju o Tableau, a platí i o Power BI, bych zmínil širší možnosti datových zdrojů, datového modelování, vizualizační komponenty třetích stran apod. Akorát ouha… když jste zvyklí na Tableau a chcete začít dělat s Power BI, až příliš často budete narážet na různé podivnosti, jakože, proč se automaticky negenerují datumové dimenze pro všechny typy datových zdrojů, ale jenom pro ty majkrosoftí a pro ostatní si musíte namodelovat? Nebo proč pro některé analytické warehouses neexistuje možnost DirectQuery a musíte dělat (obří) extract? Proč direct query pro analytický (non-Microsoft) warehouse trvá tak dlouho, že uživatelsky je to vlastně nepoužitelný? Atd. atd.

Ale, máte li ve firmě celou infrastrukturu Office360 (kterou Power BI po seriozní práci vyžaduje) a máte většinu datových zdrojů z MS světa, pak je Power BI super řešení pro vás. Jen pozor na různá omezení jednotlivých licencí. Např. na první dobrou se nikde nedočtete, že Pro licence (pouhých $9 za uživatele a měsíc) omezuje nejen velikost uživatelského workspace na 10GB, ale také velikost publikovaného datasetu na 1GB, takže brzy začnete jen optimalizovat a optimalizovat, abyste se vešli. A přestanete dělat svoji práci - analýzu.

Ještě jeden use case musím zmínit a to je realtime streamování dat do Power BI datasetu. Přes REST můžete v reálném čase pushovat do datasetu nové záznamy a měnit existující. Tohle zatím v jiných toolech moc nenajdete, takže pokud řešite realtime monitoring procesu, rozhodně uvažujte o Power BI, i kdybyste neměli celou MS infrastrukturu. Protože tohle se hochům z Redmontu fakt povedlo.

GoodData

Po mnoha letech do toho  naše oblíbená GoodData opravdu šlápla. Zdaleka nemá všechny možnosti, co má Tableau a Power BI. Dala se jinou cestou. Pokud máte hodně (a opravdu hodně) uživatelů a chcete jim distribuovat data a analýzy, nebo potřebujete analytiku embednout do vašeho produktu, pak jste na správné adrese. GoodData dokonce před časem opustila magic quadrant Gartneru “business intelligence” a vymyslela si vlastní “data distribution”.

Z pohledu uživatele naštěstí nehoní Tableau a Power BI, ale soustředí se při designu na konkrétní analytické use cases. Třeba JTým zmiňovaný zmiňovaný KPI wigdet, nebo oddělení date pickeru od dautmové dimenze, jsou super nápady, které když vidíte, tak si říkáte, jak je možný, že tohle Tableau ani Power BI ještě nemají a stále tyhle věci musíte složitě hackovat a trávit na tom opakovaně fůru času. Jo abych nezapomněl. MAQL je prostě MAQL, na to žádný calulated fields nebo DAX doteď prostě nemaj.

A na závěr? Ceník jejich growth plánu rozhodně vede k zamyšlení! Mrkněte na to.

Chachá, tak co? Je to jasný? Jestli ne, tady je slíbená tabulka.
 

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Radovan Jirka
datový detektiv
LinkedIn

Váš mozek miluje paterny - nevěříte? [cvičení]

Váš mozek miluje paterny - nevěříte? [cvičení]

Náš mozek neustále zpracovává vše, co kolem sebe vidíme a cítíme. Jde o ohromné množství informací a podnětů. Zároveň ale skvěle detekuje rozdíly a podobnosti. Prostě miluje paterny! Nevěříte? Pojďte si zkusit tohle cvičení, které s oblibou dáváme během školení Czechitas.

Základní datové typy

Základní datové typy

Datové typy. Jeden ze základních stavebních kamenů datové analytiky a programování vůbec. Správná klasifikace datového typu nám ulehčí spoustu budoucích troubles. Tak se na to pojďme podívat. A jak už je zvykem, přidali jsme i pár zajímavých odkazů s problematikou.

Design Patterns #3: is_deleted / last_modified

Design Patterns #3: is_deleted / last_modified

Nikdy, nikdy, nikdy nemažeme záznamy z databáze! A naopak vždy označujeme poslední změnu timestampou. Proč? A pokud k tomu přece jen dojde, tak co s tím? To si pojďme říct v dnešní mňamce od naší nové teamleaderky Petry.