Jak mít uklizeno ve vizualizační platformě (GoodData) | Mňamka #126
Mít uklizeno ve vizualizační platformě je občas docela oříšek. Co dělat, abychom se z toho nezbláznili a nestrávili víc času hledáním metriky/reportu než analytickou prací samotnou?
Máme tu pár tipů pro pořádek v GoodData, ale většina aktivit může být aplikována i na ostatní vizualizační tools.
Nepleťte si pojmy s dojmy
Vše začíná u výstižných a konzistentních názvů (aneb nenazývejte operátora v jedné tabulce agentem a v druhé userem :) To se hrozně lehce řekne, ale není to tak jednoduché dodržet že? Systémy i lidé se střídají/migrují a "entropie vzrůstá"...
Jak z toho ven? Zaveďte v podniku businessový slovník (ve kterém lze mimojiné fulltextově vyhledávat) a zařaďte ho do procesu validace nových či změnových požadavků. Jeho samotné vytváření vás donutí jasně definovat pojmy (včetně metrik), uživatelům nebudete muset furt vysvětlovat, kdo je a kdo už není nový zákazník a nám datařům toho operátora/agenta/usera můžete mlátit o hlavu dokud to jednoho krásného dne nesjednotíme. Předejdete tím i vytváření duplicitních metrik.
Utřiďte si Data Catalog
V novém GoodData si můžete zapnout roztřídění dle Folders, což vám atributy roztřídí dle tabulek a metriky dle složek. Já osobně preferuju zapnout rozbalení seznamu jako defaultní chování. Pokud toto roztřídění z jakéhokoliv důvodu nepoužíváte, tak se v GoodData vyplatí do každého názvu sloupce přidat i do závorky i název tabulky.

Využívejte Drill Down Paths
Naučte uživatele drillovat (nejen) do hierarchie atributu. Ušetříte tím nejen GoodData šťávu, ale hlavně se zbavíte spousty reportů, které vlastně ukazují to samé, jen přes jinou úroveň detailu.
Dolujte metadata
GoodData metadata lze používat pro optimalizaci LDM skrze identifikaci nepoužívaných tabulek či atributů, úklid nepoužívaných či duplicitních metrik i reportů, zajištění konzistence metrik napříč více projekty (metrika je stejně definovaná ve všech projektech) nebo i pro aktualizace výše zmíněného businessového slovníku (související objekty, definice, popis metriky).
Zapomněla jsem na něco? Chcete se na něco zeptat? Napište mi.
Verča
Jak na web scraping prakticky? | Mňamka #514
Převod informací z webových stránek, které používají HTML a JavaScript, do čitelného formátu v podobě řádků a sloupců (tabulek) pro účely analýzy, se provádí procesem nazývaným web scraping, což je zkrácenina pro sbírání dat z webových stránek. Jednoduše řečeno, jde o kopírování obsahu webových stránek na jiné místo. Cílem tohoto článku je poskytnout praktický průvodce tím, jak to udělat.
Představení Microsoft Fabric | Mňamka #515
Dovolte nám představit Microsoft Fabric - komplexní analytickou platformu, která spojuje všechna data a analytické nástroje, které organizace potřebují. Fabric integruje technologie jako Azure Data Factory, Azure Synapse Analytics a Power BI do jednoho jednotného produktu, umožňující jak datovým, tak obchodním profesionálům odemknout potenciál svých dat a položit základy pro éru umělé inteligence.
Jak vytvořit nejlepší čárové grafy? | Mňamka #513
Čárové grafy patří mezi jedny z nejoblíbenějších grafů ve světě datové vizualizace. Umí přehledně sdělit data bez nutnosti dlouhých vysvětlení. Nicméně, aby byla jejich síla efektivně využita, je třeba dodržovat klíčové principy a osvědčené postupy. Jaká pravidla zde platí?