Jak mít uklizeno ve vizualizační platformě (GoodData) | Mňamka #126

Mít uklizeno ve vizualizační platformě je občas docela oříšek. Co dělat, abychom se z toho nezbláznili a nestrávili víc času hledáním metriky/reportu než analytickou prací samotnou? 

Máme tu pár tipů pro pořádek v GoodData, ale většina aktivit může být aplikována i na ostatní vizualizační tools.

Nepleťte si pojmy s dojmy

Vše začíná u výstižných a konzistentních názvů (aneb nenazývejte operátora v jedné tabulce agentem a v druhé userem :) To se hrozně lehce řekne, ale není to tak jednoduché dodržet že? Systémy i lidé se střídají/migrují a "entropie vzrůstá"...

Jak z toho ven? Zaveďte v podniku businessový slovník (ve kterém lze mimojiné fulltextově vyhledávat) a zařaďte ho do procesu validace nových či změnových požadavků. Jeho samotné vytváření vás donutí jasně definovat pojmy (včetně metrik), uživatelům nebudete muset furt vysvětlovat, kdo je a kdo už není nový zákazník a nám datařům toho operátora/agenta/usera můžete mlátit o hlavu dokud to jednoho krásného dne nesjednotíme. Předejdete tím i vytváření duplicitních metrik.

Utřiďte si Data Catalog

V novém GoodData si můžete zapnout roztřídění dle Folders, což vám atributy roztřídí dle tabulek a metriky dle složek. Já osobně preferuju zapnout rozbalení seznamu jako defaultní chování. Pokud toto roztřídění z jakéhokoliv důvodu nepoužíváte, tak se v GoodData vyplatí do každého názvu sloupce přidat i do závorky i název tabulky.

Využívejte Drill Down Paths

Naučte uživatele drillovat (nejen) do hierarchie atributu. Ušetříte tím nejen GoodData šťávu, ale hlavně se zbavíte spousty reportů, které vlastně ukazují to samé, jen přes jinou úroveň detailu.

Dolujte metadata

GoodData metadata lze používat pro optimalizaci LDM skrze identifikaci nepoužívaných tabulek či atributů, úklid nepoužívaných či duplicitních metrik i reportů, zajištění konzistence metrik napříč více projekty (metrika je stejně definovaná ve všech projektech) nebo i pro aktualizace výše zmíněného businessového slovníku (související objekty, definice, popis metriky).

Zapomněla jsem na něco? Chcete se na něco zeptat? Napište mi. 

Verča

Veronika Špryslová
datový detektiv
LinkedIn

Banana data podcast | Mňamka #242

Banana data podcast | Mňamka #242

Chcete být v obraze a vědět, co se aktuálně děje ve světě dat? Slyšeli jste o Banana Data Podcastu? Pokud vás baví technologické trendy a témata jako zjednodušování AI, etická dilemata AI, otazníky proč a jak v datové vědě a mnoho dalších, můžeme vřele doporučit! Banana data podcasty už nějaký ten rok jedou a je z čeho vybírat!

APIFY: 10 nejlepších nástrojů pro web scraping | Mňamka #241

APIFY: 10 nejlepších nástrojů pro web scraping | Mňamka #241

Chcete být v obraze a vědět, co se aktuálně děje ve světě dat? Slyšeli jste o Banana Data Podcastu? Pokud vás baví technologické trendy a témata jako zjednodušování AI, etická dilemata AI, otazníky proč a jak v datové vědě a mnoho dalších, můžeme vřele doporučit! Banana data podcasty už nějaký ten rok jedou a je z čeho vybírat!

Ze života datového detektiva I. - Průvodce světem dat

Ze života datového detektiva I. - Průvodce světem dat

Hodně často kolem sebe slýcháme otázku: a co že vy teda děláte? První díl z celkem čtyř o tom, jak datový detektiv funguje v každodenním životě. Naše práce je opravdu hodně komplexní a musíme zdatně propojovat analytické a businessové skills. Začneme tím, jak probíhá náš první kontakt se zákazníkem! Datový detektiv je totiž také obchoďák a accounťák. Eva a Rado vám umožní nahlédnout do svých běžných pracovních dnů. Co dělají? Jak probíhají první jednání s budoucími zákazníky a co je na tom baví?