Design Patterns #4: Agregace long tail a ‘ostatní’ | Mňamka #50
‘long tail’
Agregace ‘long tail’ znamená sjednocení různých hodnot atributů, které ve skutečnosti reprezentují totéž pomocí jednoduché mapovací tabulky. Long tail agregaci typicky využíváme při práci s daty z Google Analytics. Tagování trafficu často probíhá manuálně, nebo tagy generují různé systémy a názvy nejsou jednotné.
Proč?
Získáme tak ucelenější pohled na data a zároveň neztratíme detail. Managery zajímá, kolik trafficu zdroj přinesl třeba google, jestli to bylo placené medium nebo ne, markeťáky zajímá detail. Ideální je použít třeba Google Sheet, který může uživatel sám průběžně modifikovat dle potřeby (marketing může dynamicky čistit data z GA).
"ostatní"
Podobně můžeme pro přehlednější zobrazení v grafu některé hodnoty atributů agregovat pod 'other', např. zobrazíme fixní počet největších zákazníků, nebo jen zákazníky přesahující určitou hodnotu objednávky.
A pokud si chcete připomenout video od Radovana "Jak efektivně čistit data v Google Anayltics, tak tady je.
Petra
Kdy nepoužívat sloupcové grafy? | Mňamka #463
Sloupcové grafy jsou skvělým a snadno srozumitelným nástrojem pro vizualizaci dat. Není proto divu, že se těší značné popularitě. Problémem ale je, že jsou často využívány i v situacích, na které se příliš nehodí, což může vést k nesprávné či zavádějící interpretaci dat. Typicky se to stává např. při jejich použití k zobrazení sumárních statistik, jakou jsou průměry či mediány, kdy může docházet až k přílišné ztrátě detailu. V dnešní mňamce si ukážeme, proč je v takových případech většinou lepší zvolit jiný typ grafu!