Metriky a dimenze | Mňamka #64
Já vím, já vím! Je to přece úplně triviální záležitost... Ale...Jste si tím jisti?
Často se při lektorování studentek ptám, co to je metrika a dimenze. Odpovědi jsou různé a ne vždy je v tom úplně jasno. A tak jsem se rozhodla vrátit k úplným základům a postupně je probrat. Vítejte v takové malé bizztreat akademii :-)
Tabulka jako základní stavební jednotka
Než se podíváme na samotné metriky a dimenze, je potřeba se podívat o krok zpět. Tabulka patří do tzv. strukturovaných dat (o tom si povíme někdy příště). Asi každý znás je schopen říct, že tabulka - představte si třeba tu klasickou excelovou - má nějaké řádky a sloupce. To je dobrý start, ale pro datového analytika je to trochu málo.
Takže, z čeho se taková obyčejná tabulka může skládat:
- řádky a sloupce
- datové typy - přečtěte si více o základních datových typech: Základní datové typy
- identifikátory - projdeme si někdy příště (id_klienta a id_sidlo)
- fakta -> metriky (hodnoty)
- atributy, dimenze (charakteristiky)
A protože se nejlépe vysvětluje na příkladu - tady je tabulka, která všechno vyjmenované obsahuje:

Organizace se stává tím, co měří
Na začátku je potřeba si říci, jaké sloupce jsou pro nás důležité a v tabulce by měly zůstat. Některé tabulky jsou plné informací, které vlastně ani nebudeme potřebovat. Než se tedy do něčeho pustíte, je nutnost si dobře definovat use case nebo výstupy. Je dobré si například položit otázky:
- Čeho hodlám dosáhnout?
- Jaké chování sleduji?
- Co naplňuje moje cíle?
A o tom to vlastně je - abyste si mohli navrhnout dobrý datový model, který bude splňovat business požadavky, musíte vědět, na co se chcete dívat (fakta, metriky) a přes co (atributy, dimenze).
Fakta
jsou vlastně konkrétní hodnoty - čísla, ukazatele, absolutní hodnoty - které chceme sledovat, se kterými chceme počítat - prostě, které pro nás mají nějaký business význam. V naší tabulce jsou to sloupce pocet_aut a najete_km.
Metriky
metrika je agregace faktu - čili už nějaký výpočet s fakty. V naší tabulce je to sloupec SUM_auta_km - protože nás zajímá, kolik celkově naše auta ujela - např. ten daný rok. Prostě nás jednoduše zajímá - kolik.
Datům přiřadíme atributy a koukáme na ně v dimenzích
Dalším krokem je otázka - jak se na data (fakta, metriky) potřebujeme dívat?
Atributy
Každé hodnotě můžeme přiřadit tzv. atribut - v podstatě je to nějaký popis - charakteristika, podle které budeme chtít naše data filtrovat - u aut to může být např. barva auta, typ auta a v naší tabulce to asi nejlépe vystihuje sloupec sidlo a klient. Na první pohled by to měl být i sloupec rok, ale my ho budeme řadit do tzv. datumové dimenze - viz níže.
Dimenze
Když víte, na co se chcete dívat (metriky), tak druhým krokem je vědět "přes co" se na data chcete dívat = dimenze. Já je ráda dělím na 3 základní druhy - prostě jednoduše kdo, kdy a kde:
- demografické dimenze - např. pohlaví, věk, muž/žena, ...
- časové (datumové) dimenze - např. rok, měsíc, hodina, ...
- interní dimenze - každá firma může mít své vlastní - např. oblast, segment, kategorie, ...
Často se setkávám i s jinými definicemi nebo dělením. Takže pokud máte nějaký svůj pohled nebo si myslíte, že to je jinak, napište mi!
Eva
Pilíře úspěšného datového projektu | Mňamka #544
V Bizztreatu máme za sebou desítky datových projektů napříč různými odvětvími např. jako e-commerce, retail, výroba, média nebo obchod. Z praxe víme, že mnoho datových projektů selhává – nedoručí očekávaný přínos, uvíznou na půli cesty nebo se zacyklí v nekonečném „ještě to ladíme“. Bez ohledu na typ projektu či sektor platí, že úspěch vždy stojí na pevných základech – pilířích, které rozhodují o tom, jestli výstup skutečně přinese byznysovou hodnotu. Právě proto je klíčové zaměřit se na to, co dělá datový projekt opravdu úspěšným. Tak pojďme na to.
Ikony v reportu: Zaujměte na první pohled a zjednodušte navigaci | Mňamka #543
Vizuální zkratky, které promění datovou džungli v přehlednou mapu. Zjistěte, jak s pomocí ikon zjednodušit navigaci, zvýraznit klíčové informace a proměnit suchá data v poutavý příběh. Naučte se vybírat vhodné ikony, pracovat s nimi efektivně a odhalte, proč je jejich správné použití klíčové pro srozumitelnost a úspěch vašich reportů.
Jak předvídat chování zákazníků: Churn, životní hodnota a další klíčové ukazatele | Mňamka #542
Porozumění chování zákazníků a jeho predikce jsou dnes klíčové pro firmy, které chtějí budovat loajalitu, zlepšit cílení kampaní a efektivně řídit své marketingové investice. Jak předpovědět, kdy zákazník odejde, jakou má pro firmu hodnotu nebo kdy s největší pravděpodobností znovu nakoupí? V článku se podíváme na klíčové koncepty, jako je predikce odchodu zákazníků (churn), výpočet jejich životní hodnoty (Lifetime Value), odhad pravděpodobnosti další interakce či modelování sklonu k nákupu. Získané poznatky mohou pomoci vytvářet efektivnější marketingové strategie a lepší zákaznickou zkušenost.