Jak mít uklizeno ve vizualizační platformě (GoodData) | Mňamka #126

Mít uklizeno ve vizualizační platformě je občas docela oříšek. Co dělat, abychom se z toho nezbláznili a nestrávili víc času hledáním metriky/reportu než analytickou prací samotnou? 

Máme tu pár tipů pro pořádek v GoodData, ale většina aktivit může být aplikována i na ostatní vizualizační tools.

Nepleťte si pojmy s dojmy

Vše začíná u výstižných a konzistentních názvů (aneb nenazývejte operátora v jedné tabulce agentem a v druhé userem :) To se hrozně lehce řekne, ale není to tak jednoduché dodržet že? Systémy i lidé se střídají/migrují a "entropie vzrůstá"...

Jak z toho ven? Zaveďte v podniku businessový slovník (ve kterém lze mimojiné fulltextově vyhledávat) a zařaďte ho do procesu validace nových či změnových požadavků. Jeho samotné vytváření vás donutí jasně definovat pojmy (včetně metrik), uživatelům nebudete muset furt vysvětlovat, kdo je a kdo už není nový zákazník a nám datařům toho operátora/agenta/usera můžete mlátit o hlavu dokud to jednoho krásného dne nesjednotíme. Předejdete tím i vytváření duplicitních metrik.

Utřiďte si Data Catalog

V novém GoodData si můžete zapnout roztřídění dle Folders, což vám atributy roztřídí dle tabulek a metriky dle složek. Já osobně preferuju zapnout rozbalení seznamu jako defaultní chování. Pokud toto roztřídění z jakéhokoliv důvodu nepoužíváte, tak se v GoodData vyplatí do každého názvu sloupce přidat i do závorky i název tabulky.

Využívejte Drill Down Paths

Naučte uživatele drillovat (nejen) do hierarchie atributu. Ušetříte tím nejen GoodData šťávu, ale hlavně se zbavíte spousty reportů, které vlastně ukazují to samé, jen přes jinou úroveň detailu.

Dolujte metadata

GoodData metadata lze používat pro optimalizaci LDM skrze identifikaci nepoužívaných tabulek či atributů, úklid nepoužívaných či duplicitních metrik i reportů, zajištění konzistence metrik napříč více projekty (metrika je stejně definovaná ve všech projektech) nebo i pro aktualizace výše zmíněného businessového slovníku (související objekty, definice, popis metriky).

Zapomněla jsem na něco? Chcete se na něco zeptat? Napište mi. 

Verča

Veronika Špryslová
datový detektiv
LinkedIn

Jak na pavučinové grafy | Mňamka #437

Jak na pavučinové grafy | Mňamka #437

Pavučinové (neboli paprskové) grafy patří k nejimpozantnějším grafům, se kterými se v moderních byznysových vizualizacích můžete setkat. Hodí se např. k porovnání dvou produktů na základě široké škály různých ukazatelů. Nebo jsou hojně využívány ve sportovní analytice ke komparativnímu srovnání výkonů jednotlivých hráčů. Pro nezasvěcené publikum ale mohou být jen obtížně stravitelné. Dnes si proto ukážeme, jakých zásad se při vytváření pavučinových grafů držet a jak se v nich co nejlépe orientovat!

5 mýtů o cloudu | Mňamka #436

5 mýtů o cloudu | Mňamka #436

Řešit data v cloudu dává smysl čím dál většímu počtu firem. A není se čemu divit, cloud totiž nabízí neuvěřitelnou flexibilitu a jednoduchost použití. Přesto se ale stále najde spousta firem, které jedou kompletně on-premise a s přechodem na cloud váhají. Někdy má takové rozhodnutí objektivní důvody, často ale bývá spíše výsledkem mylných představ, které o cloudových datových skladech panují. A právě na to si posvítíme v této mňamce. Pojďte se se spolu s námi podívat na 5 nejčastějších mýtů o cloudu!

Pandas – k čemu slouží, k čemu jej raději nepoužijeme a jeho alternativy | Mňamka #435

Pandas – k čemu slouží, k čemu jej raději nepoužijeme a jeho alternativy | Mňamka #435

Pandas je jednou z nejpoužívanějších knihoven pro zpracování dat v jazyce Python. Jeho největší předností je zejména jednoduchá a intuitivní syntaxe a také rychlost, se kterou můžete zpracovávat velké datové soubory. V BizzTreatu ho proto často využíváme např. pro ad hoc analýzy dat, kdy potřebujeme rychle prozkoumat, jak data vlastně vypadají a jaká je jejich kvalita. V dnešní mňamce od Báry si ukážeme, kde všude lze Pandas použít a jak si stojí v porovnání s ostatními knihovnami!