Design Patterns #4: Agregace long tail a ‘ostatní’ | Mňamka #50
‘long tail’
Agregace ‘long tail’ znamená sjednocení různých hodnot atributů, které ve skutečnosti reprezentují totéž pomocí jednoduché mapovací tabulky. Long tail agregaci typicky využíváme při práci s daty z Google Analytics. Tagování trafficu často probíhá manuálně, nebo tagy generují různé systémy a názvy nejsou jednotné.
Proč?
Získáme tak ucelenější pohled na data a zároveň neztratíme detail. Managery zajímá, kolik trafficu zdroj přinesl třeba google, jestli to bylo placené medium nebo ne, markeťáky zajímá detail. Ideální je použít třeba Google Sheet, který může uživatel sám průběžně modifikovat dle potřeby (marketing může dynamicky čistit data z GA).

"ostatní"
Podobně můžeme pro přehlednější zobrazení v grafu některé hodnoty atributů agregovat pod 'other', např. zobrazíme fixní počet největších zákazníků, nebo jen zákazníky přesahující určitou hodnotu objednávky.
A pokud si chcete připomenout video od Radovana "Jak efektivně čistit data v Google Anayltics, tak tady je.
Petra
Jak na web scraping prakticky? | Mňamka #514
Převod informací z webových stránek, které používají HTML a JavaScript, do čitelného formátu v podobě řádků a sloupců (tabulek) pro účely analýzy, se provádí procesem nazývaným web scraping, což je zkrácenina pro sbírání dat z webových stránek. Jednoduše řečeno, jde o kopírování obsahu webových stránek na jiné místo. Cílem tohoto článku je poskytnout praktický průvodce tím, jak to udělat.
Představení Microsoft Fabric | Mňamka #515
Dovolte nám představit Microsoft Fabric - komplexní analytickou platformu, která spojuje všechna data a analytické nástroje, které organizace potřebují. Fabric integruje technologie jako Azure Data Factory, Azure Synapse Analytics a Power BI do jednoho jednotného produktu, umožňující jak datovým, tak obchodním profesionálům odemknout potenciál svých dat a položit základy pro éru umělé inteligence.
Jak vytvořit nejlepší čárové grafy? | Mňamka #513
Čárové grafy patří mezi jedny z nejoblíbenějších grafů ve světě datové vizualizace. Umí přehledně sdělit data bez nutnosti dlouhých vysvětlení. Nicméně, aby byla jejich síla efektivně využita, je třeba dodržovat klíčové principy a osvědčené postupy. Jaká pravidla zde platí?