Design Patterns #4: Agregace long tail a ‘ostatní’ | Mňamka #50

‘long tail’

Agregace ‘long tail’ znamená sjednocení různých hodnot atributů, které ve skutečnosti reprezentují totéž pomocí jednoduché mapovací tabulky. Long tail agregaci typicky využíváme při práci s daty z Google Analytics. Tagování trafficu často probíhá manuálně, nebo tagy generují různé systémy a názvy nejsou jednotné.

Proč?

Získáme tak ucelenější pohled na data a zároveň neztratíme detail. Managery zajímá, kolik trafficu zdroj přinesl třeba google, jestli to bylo placené medium nebo ne, markeťáky zajímá detail. Ideální je použít třeba Google Sheet, který může uživatel sám průběžně modifikovat dle potřeby (marketing může dynamicky čistit data z GA).

"ostatní"

Podobně můžeme pro přehlednější zobrazení v grafu některé hodnoty atributů agregovat pod 'other', např. zobrazíme fixní počet největších zákazníků, nebo jen zákazníky přesahující určitou hodnotu objednávky. 

A pokud si chcete připomenout video od Radovana "Jak efektivně čistit data v Google Anayltics, tak tady je.

Petra

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Petra Horáčková
datový detektiv
LinkedIn

Google Workspaces - Přestaňte platit za centrální správu podpisů v Gmailu

Google Workspaces - Přestaňte platit za centrální správu podpisů v Gmailu

Přišli jsme o správu e-mailových podpisů při přechodu k novému GCP partnerovi. Místo placení SaaS nástrojů jsem to postavil za odpoledne přes Google Apps Script – zdarma. Tady je celý návod.

AI Audit: Když chcete vědět, kde ve firmě AI dává smysl (a kde ne)| Mňamka #552

AI Audit: Když chcete vědět, kde ve firmě AI dává smysl (a kde ne)| Mňamka #552

Znáte to – CEO se vrátí z konference a ptá se „a my s tou AI něco děláme?“, IT má pět různých nápadů, co by se dalo zkusit, marketing chce chatbota, a ve skutečnosti nikdo přesně neví, co z toho má smysl a kde začít. AI audit je pro firmy, které nechtějí jen naskakovat do vlaku, ale chtějí vědět, kam ten vlak vlastně jede. Typicky to jsou střední a velké společnosti, které už mají digitalizované procesy a nějaká data – a teď zjišťují, že „AI strategie“ nemůže být „zkusíme, uvidíme“.

Metadata management: Proč je katalog dat nutností, ne luxusem | Mňamka #551

Metadata management: Proč je katalog dat nutností, ne luxusem | Mňamka #551

“Metadata jsou data o datech.“ - tohle, když od nás slyšeli profesoři na VŠE (Vysoké škole ekonomické), rovnou nás poslali ze zkoušky domů s tím, že se za nedlouho opět uvidíme. 😀Ona je to sice pravda, ale nejde ani tak úplně o jednu pevně stanovenou “definici” jako spíš o tu samotnou podstatu. Díky metadatům organizace chápe svá data, své systémy i pracovní postupy, protože metadata popisují, vysvětlují a usnadňují vyhledání, použití a správu jakéhokoliv datového zdroje.