Jak mít uklizeno ve vizualizační platformě (GoodData) | Mňamka #126

Mít uklizeno ve vizualizační platformě je občas docela oříšek. Co dělat, abychom se z toho nezbláznili a nestrávili víc času hledáním metriky/reportu než analytickou prací samotnou? 

Máme tu pár tipů pro pořádek v GoodData, ale většina aktivit může být aplikována i na ostatní vizualizační tools.

Nepleťte si pojmy s dojmy

Vše začíná u výstižných a konzistentních názvů (aneb nenazývejte operátora v jedné tabulce agentem a v druhé userem :) To se hrozně lehce řekne, ale není to tak jednoduché dodržet že? Systémy i lidé se střídají/migrují a "entropie vzrůstá"...

Jak z toho ven? Zaveďte v podniku businessový slovník (ve kterém lze mimojiné fulltextově vyhledávat) a zařaďte ho do procesu validace nových či změnových požadavků. Jeho samotné vytváření vás donutí jasně definovat pojmy (včetně metrik), uživatelům nebudete muset furt vysvětlovat, kdo je a kdo už není nový zákazník a nám datařům toho operátora/agenta/usera můžete mlátit o hlavu dokud to jednoho krásného dne nesjednotíme. Předejdete tím i vytváření duplicitních metrik.

Utřiďte si Data Catalog

V novém GoodData si můžete zapnout roztřídění dle Folders, což vám atributy roztřídí dle tabulek a metriky dle složek. Já osobně preferuju zapnout rozbalení seznamu jako defaultní chování. Pokud toto roztřídění z jakéhokoliv důvodu nepoužíváte, tak se v GoodData vyplatí do každého názvu sloupce přidat i do závorky i název tabulky.

Využívejte Drill Down Paths

Naučte uživatele drillovat (nejen) do hierarchie atributu. Ušetříte tím nejen GoodData šťávu, ale hlavně se zbavíte spousty reportů, které vlastně ukazují to samé, jen přes jinou úroveň detailu.

Dolujte metadata

GoodData metadata lze používat pro optimalizaci LDM skrze identifikaci nepoužívaných tabulek či atributů, úklid nepoužívaných či duplicitních metrik i reportů, zajištění konzistence metrik napříč více projekty (metrika je stejně definovaná ve všech projektech) nebo i pro aktualizace výše zmíněného businessového slovníku (související objekty, definice, popis metriky).

Zapomněla jsem na něco? Chcete se na něco zeptat? Napište mi. 

Verča

Veronika Špryslová
datový detektiv
LinkedIn

Cirkulární graf co rozbil twitter | Mňamka #279

Cirkulární graf co rozbil twitter | Mňamka #279

V této mňamce se podíváme na trochu vizualizačního masakru, co udělal velký rozruch na Twitteru. Jde o graf, který vytvořili v New York Times a někteří ho už sedmí den roku 2022 nazvali nejhorší vizualizací tohoto roku. Jakožto každá trochu kontroverzní věc má i tento graf svoje obhájce. Co myslíte? Je to super způsob, jak ukázat timeline dat anebo to vypadá otřesně a někomu by měli sebrat licenci k vizuálním nástrojům?

Co je to Data Security? | Mňamka #278

Co je to Data Security? | Mňamka #278

V tomto článku se podíváme na základy toho, co je Data security neboli datová bezpečnost. V bizztreatu nám na security záleží, a myslíme si, že toto bude jedno z „hot“ témat roku 2022. Pojďme is tedy připomenout co se pod tímto výrazem skrývá. Pod odkazem se skrývá článek z dataversity, který vás navede na velké množství zdrojů o datové bezpečnosti například od MIT. Tak se pojďte podívat co je v bezpečnosti nového a proč je to tak důležité.

Ze života datového detektiva 4: Designér, architekt a konzultant #277

Ze života datového detektiva 4: Designér, architekt a konzultant #277

Je to tady, další článek ze seriálu „Ze života datového detektiva“, tentokrát se budeme bavit o tom co dělá architekt, designér a konzultant v Bizztreatu. Naše Verča vám to pěkně sepsala a je to fakt zajímavý čtení s hromadou prokliků na další zajímavý kontent od nás. Zajímá vás, jak to v bizztreatu s architekturou děláme? Jaký je postup pro architekta samotného? Nebo jak na architekturu navazuje datová kvalita a data governance? Pokud jste na jednu z těchto otázek odpověděli „ano“ tak šup na link a pusťte se do toho.