Design Patterns #4: Agregace long tail a ‘ostatní’ | Mňamka #50

‘long tail’

Agregace ‘long tail’ znamená sjednocení různých hodnot atributů, které ve skutečnosti reprezentují totéž pomocí jednoduché mapovací tabulky. Long tail agregaci typicky využíváme při práci s daty z Google Analytics. Tagování trafficu často probíhá manuálně, nebo tagy generují různé systémy a názvy nejsou jednotné.

Proč?

Získáme tak ucelenější pohled na data a zároveň neztratíme detail. Managery zajímá, kolik trafficu zdroj přinesl třeba google, jestli to bylo placené medium nebo ne, markeťáky zajímá detail. Ideální je použít třeba Google Sheet, který může uživatel sám průběžně modifikovat dle potřeby (marketing může dynamicky čistit data z GA).

"ostatní"

Podobně můžeme pro přehlednější zobrazení v grafu některé hodnoty atributů agregovat pod 'other', např. zobrazíme fixní počet největších zákazníků, nebo jen zákazníky přesahující určitou hodnotu objednávky. 

A pokud si chcete připomenout video od Radovana "Jak efektivně čistit data v Google Anayltics, tak tady je.

Petra

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Petra Horáčková
datový detektiv
LinkedIn

Excel or Not to Excel?

Excel or Not to Excel?

Excel can be a great tool for quick analyses, but it’s long been unsuitable for managing medium and large businesses. If you’ve ever tried opening a massive file with thousands of records, you know exactly what we mean. But it’s not just about wasted time—“Excel-ing” in a large company can cost you a fortune. How much? Find out in today’s Mňamka, where Patrik breaks down the biggest pain points of handling data in Excel! 🚀

 Agilní datová analytika pomáhá MALFINI řídit výkon obchodníků a zvyšovat tržby meziročně o 30 %

Agilní datová analytika pomáhá MALFINI řídit výkon obchodníků a zvyšovat tržby meziročně o 30 %

Automatický reporting stavu objednávek a úspěšnější vytížení vozové flotily o 20%

Automatický reporting stavu objednávek a úspěšnější vytížení vozové flotily o 20%