Design Patterns #4: Agregace long tail a ‘ostatní’ | Mňamka #50

‘long tail’

Agregace ‘long tail’ znamená sjednocení různých hodnot atributů, které ve skutečnosti reprezentují totéž pomocí jednoduché mapovací tabulky. Long tail agregaci typicky využíváme při práci s daty z Google Analytics. Tagování trafficu často probíhá manuálně, nebo tagy generují různé systémy a názvy nejsou jednotné.

Proč?

Získáme tak ucelenější pohled na data a zároveň neztratíme detail. Managery zajímá, kolik trafficu zdroj přinesl třeba google, jestli to bylo placené medium nebo ne, markeťáky zajímá detail. Ideální je použít třeba Google Sheet, který může uživatel sám průběžně modifikovat dle potřeby (marketing může dynamicky čistit data z GA).

"ostatní"

Podobně můžeme pro přehlednější zobrazení v grafu některé hodnoty atributů agregovat pod 'other', např. zobrazíme fixní počet největších zákazníků, nebo jen zákazníky přesahující určitou hodnotu objednávky. 

A pokud si chcete připomenout video od Radovana "Jak efektivně čistit data v Google Anayltics, tak tady je.

Petra

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Petra Horáčková
datový detektiv
LinkedIn

Dovednosti datového analytika | Mňamka #105

Dovednosti datového analytika | Mňamka #105

Zájem o pořádná a kvalitní firemní data roste. S tím je spojen i velký zájem o datové analytiky. Ale nejprve, co to vlastně je datový analytik a co za dovednosti by měl mít? V článku vybrali hned osm, my v BizzTreat stojíme vlastně jen o tři: Selský rozum, základy SQL (Python) a ochotu se učit.

Slack workflow: Jak si zjednodušit a automatizovat práci ve Slacku | Mňamka #104

Slack workflow: Jak si zjednodušit a automatizovat práci ve Slacku | Mňamka #104

Celkem ostuda na to, že používáme Slack už roky. Kdyby se k nám nově nepřidal Ondra, o této vychytávce bychom neměli ani tušení. Jak si zjednodušit a hlavně automatizovat práci pomocí Slacku a to hlavně při psaní různých pravidelných updatů? Třeba notifikací s formulářem k vyplnění před ranním standupem.

Statistické vztahy letem světem | Mňamka #103

Statistické vztahy letem světem | Mňamka #103

Statistika k datařině prostě patří. Pro základní pochopení není potřeba hned zacházet do podrobností. Tak postupně: Asociační a korelační analýza, nulová hypotéza, hodnoty p, mezní hodnota... No a jako třešničku se dovíte, proč vám konzumace zmrzliny nezvyšuje pravděpodobnost utopit se, když jdete plavat.