Power BI - vše, co potřebujete vědět | Mňamka #162

Takový ten divný pocit, když vás Eva požádá, ať napíšete článek o Power BI, protože víte, že ať napíšete cokoliv, moc dobrý feedback na to nedostanete. Proč? Protože většina lidí Power BI buď bezmězně miluje nebo naopak z duše nenávidí. I já si toho s Power BI prožila spoustu - krásné chvilky plné radosti i bezesné noci, kdy se slzami v očích už nevíte, jak dál. Tvrzení aplikovatelné na většinu mých vztahů nejen s BI tooly :)

Co je Power BI?

BI tool od Microsoftu, v současnosti považovaný za industry leadera (v kombinaci s ostatními produkty MS). Kromě vizualizací poskytuje i self-service pro přípravu dat a spojování dat z více zdrojů PowerQuery. A v neposlední řadě, alespoň v naší firmě - noční můra majitelů mekařů :)

Cena

Základní Pro licence vás vyjde na $10 za uživatele za měsíc, musíte si ale dávat pozor na 1GB limit per dataset a 10GB limit per pracovní prostor. Hlavně první ze zmiňovaných limitů je opravdu limitující a ve firmách, kde zatím není budget na pořízení Premium pracovního prostoru (od $5000 za měsíc), je třeba s tímto limitem velmi aktivně pracovat při designu každého use casu. Úzce to souvisí se způsobem napojení dat.

Způsob napojení dat

Existují 4 způsoby připojení dat: live (pro OLAP kostky a vypublikované datasety), direct (pro podporované databáze), import (klasický extrakt) a push (vhodný pro realtime). Lze vytvořit i tzv. composite model, který může být kombinací například 3 direct tabulek a 5 importovaných tabulek. Před volbou správného způsobu napojení je třeba nastudovat, jak to funguje, je tam i pár limitů. O tom třeba příště :)

PowerQuery - dobrý sluha, sakra špatný pán

PowerQuery je sice neuvěřitelně užitečný nástroj pro ad hoc přípravu dat, prototyping apod., ale používá-li se u větších než totálně prťavých projektů i pro celofiremní produkční reporting, tak je to cesta do pekel. 

  • Single source of truth neexistuje a nezajistíte to, ani kdybyste se na hlavu postavili
  • Když se vám něco rozbije, dohledat chybu může být někdy na mašli
  • Změnit logiku kalkulace, optimalizovat, nedejbože očišťovat data trvá asi tak 100000000000000x déle než v SQL

A ano, teď už existují dataflows, které alespoň problém se single source of truth při extrémně kvalitní implementaci dokáží řešit, ale ostatní zmiňované problémy dle mého názoru stále přetrvávají. Power BI je vizualizační nástroj, nikoliv ETL. Na hraní je to ale šikovné :)

Datový model a metriky

Ať si řiká, kdo chce to chce, mě se v tom modeluje dobře a i ty metriky se píšou celkem jednodušše. DAX dokáže občas trochu pozlobit, ale pokud si správně postavíte model, tak abyste to pak nemuseli v metrikách dohánět a ohýbat přes koleno, jde to. Samozřejmě zkomplikovat se dá cokoliv a v tomto ohledu je třeba přistupovat například k radám na Power BI forech velmi kriticky, ať si tam nezanesete nějaký vynález, co neměl nikdy vzniknout.

Vizualizace

Za mě silná stránka Power BI, jde skoro všechno, je spoustu custom vizuálů (a můžete si i nakódit vlastní), můžete integrovat s Power Apps (například abyste obchoďákovi přímo v reportu dovolili upravovat sales forecast a koukat jak to vychází). Interakce, drill-ups, drill-downs, drill-through (i cross-report), tooltipy, bookmarky jsou super. Lze vytvořit zjednodušenou mobilní verzi. Takže opět jen pozor na to, abyste to nepřekombinovali.

Time-Intelligence

Pokud začínáte, zkuste se odrazit od tzv. quick measures. Lze se na nich naučit, jak ten DAX vlastně funguje. MoM, YoY, moving average, kumulativní sumu atd. máte nakliknuté na 3 kliky. Co zatím Power BI nemá moc dobře vymyšlené, je porovnání s předchozí periodou ve chvíli, kdy chcete dynamicky měnit granularitu dané periody (den, měsíc, týden, rok). Jde to vyřešit, ale musíte si zaDAXovat.

Power BI Service

Vypublikované reporty můžete vystavit jako appku (lze pak konzumovat přes Power BI Mobile), můžete z nich vytvořit dashboard (na kterém lze nastavit alerty na vývoj metrik), posílat si emaily s linkem na report vždycky když se refreshne apod. Můžete tam report i upravit, ale jen na úrovni vizualizace, na datový model se nedostanete (ani vzorec metriky si nezobrazíte). Co se nám líbí je možnost označit report či dataset jako certifikovaný, to rádi využíváme jako součást governance nad BI platformou.

Power BI Desktop

Tak a jsme u té noční můry mekařů. Ona to teda může být noční můra i všech ostatních... Když máte za úkol opravit/upravit nějaký monstrózní report, tak je to analogie k monstróznímu Excelu, co se 10 minut otvírá, aby vám pak dalších 10 minut crashoval. Je třeba to nenechat takhle daleko zajít, pečlivě designovat reporty per use case, řídit vývoj skrze governace, sledovat usage a optimalizovat. Dokud je soubor rozumně veliký a drží se best-practices, lze s tím na Windows pracovat celkem dobře. Mekaři si musí pořádně přitopit VM.

Těch témat je spoustu - embeddování, kompatibilita s non-MS systémy, scheduled refresh a getaways, API, RLS, parametry, Report builder, optimalizace, DAX Studio... Tak třeba dáme nějaké pokračování :)

Zapomněla jsem na něco? Chcete se na něco zeptat? Napište mi. 

Verča

Veronika Špryslová
datový detektiv
LinkedIn

Microsoft Fabric vs. Power BI: Jaké jsou rozdíly? | Mňamka #496

Microsoft Fabric vs. Power BI: Jaké jsou rozdíly? | Mňamka #496

Výběr správného nástroje pro analýzu dat může být náročný vzhledem k množství dostupných možností. Od společnosti Microsoft se nabízí dvě populární volby, kterými jsou Power BI a Microsoft Fabric. Pojďme se podrobněji podívat na jejich funkčnost, design, bezpečnost, zaměření na jednotlivá odvětví a mnoho dalšího.

Příběh transformace Crocodille ČR s Bizztreatem | Mňamka #495

Příběh transformace Crocodille ČR s Bizztreatem | Mňamka #495

🔊Jsme pyšný, že s vámi můžeme sdílej skutečný příběh, který píšeme už několik let s naším velkým klientem Crocodille ČR. Právě totiž vyšla nová epizoda Data Talku, ve které máme prostor vyprávět tento příběh! 💥 Reference je tou nejlepší zpětnou vazbou na naší práci, a tady ta reference zaznívá přímo od Jiřího Brothánka a dostává reálný hlas. 🥪 Jsme součástí transformace Crocodille ČR od počátečních někdy i bolestivých kroků, přes výzvy až po triumfy! Jiří Vicherek vede rozhovor s Jiřím Brothánkem, Head of IT v Crocodille, a naším team leaderem Tomášem Dědkem. Společně odhalují, jak jsme s Crocodille postupovali na cestě od tradičních business modelů k implementaci moderního BI a nyní i AI! 🕵️ Jsme hrdí, že můžeme být datovými detektivy pro jedny z hlavních hráčů na českém trhu.🎧Nenechte si tu epizodu ujít!

Zpracování dat z LinkedInu prostřednictvím ETL nástroje Bizzflow  | Mňamka #494

Zpracování dat z LinkedInu prostřednictvím ETL nástroje Bizzflow | Mňamka #494

Pro některé je LinkedIn pouze sociální sítí, na které mají svůj profesní profil, jen aby se neřeklo a pro některé může být LinkedIn jakási svatyně personal brandingu a navazování profesních kontaktů. Fakt, že LinkedIn generuje celosvětově až 80% B2B leadů ze všech sociálních sítí jen potvrzuje to, že zvláště pro firmy je LinkedIn skvělým místem, kde prezentovat svoje produkty či služby. V dnešní mňamce bych ráda mluvila o tom, jak jsem postupovala ve své bakalářské práci na téma Zpracování marketingových dat prostřednictvím ETL nástroje Bizzflow a v podstatě tak představit velmi krátký příběh, jak jsem se dostala z nápadu až k hotovému dashboardu.