Je to mezera, není to mezera? | Mňamka #370

O čištění dat a jeho významu už jsme toho napsali poměrně hodně. Jednoduše řečeno - bez úklidu na vstupu budeme mít bordel i na výstupu.

Dokonce na to máme appku (Cooltivator), která tuhle mravenčí práci umí výrazně zjednodušit. :)

Co ale dělat, když potřebujeme “přechroustat” finanční čísla (například nějaký mapovací Google sheet s budgety)? Ono totiž jeden budget můžete napsat několika způsoby - a reálně se to i stává - copy & paste a najednou tam máte nový formát. :)

Třeba takhle:

Ale co s tím? Čistící skript by měl být univerzální a umět ošetřit všechny tyto možnosti.

Vezměme si to na příkladu Snowflake SQL a pěkně postupně:

1. “číslo” - pohodička, tady není o čem

2. “finanční” - tady už nám TO_NUMBER() stačit nebude - musíme nejdřív nahradit mezery a desetinnou čárku a až poté převést na číslo – rozehříváme se :)

3. “měna” - musíme navíc vyhodit “Kč”, vyzkoušíme

“Oops.. co se děje?” říkal jsem si, když jsem to viděl poprvý a zkusil to dvakrát znovu - chyba mezi klávesnicí a židlí? Není, ani napotřetí to neprošlo... Po chvíli googlení a zkoušení mi to došlo.

Poznáte rozdíl? :)

Ne? Já taky ne, až tady je vidět:

Zatímco v prvním případě jsme nahrazovali znak mezery, v tom druhém jde o oddělovač tisíců, což sice vizuálně vypadá úplně stejně, ale jde o jiný znak.

Takže:

Voilá - funguje! :)

Zapomněl jsem na něco? Chcete se na něco zeptat? Napište mi. 

Petr

Petr Koza
datový detektiv
LinkedIn

Pilíře úspěšného datového projektu | Mňamka #544

Pilíře úspěšného datového projektu | Mňamka #544

V Bizztreatu máme za sebou desítky datových projektů napříč různými odvětvími např. jako e-commerce, retail, výroba, média nebo obchod. Z praxe víme, že mnoho datových projektů selhává – nedoručí očekávaný přínos, uvíznou na půli cesty nebo se zacyklí v nekonečném „ještě to ladíme“. Bez ohledu na typ projektu či sektor platí, že úspěch vždy stojí na pevných základech – pilířích, které rozhodují o tom, jestli výstup skutečně přinese byznysovou hodnotu. Právě proto je klíčové zaměřit se na to, co dělá datový projekt opravdu úspěšným. Tak pojďme na to.

Ikony v reportu: Zaujměte na první pohled a zjednodušte navigaci | Mňamka #543

Ikony v reportu: Zaujměte na první pohled a zjednodušte navigaci | Mňamka #543

Vizuální zkratky, které promění datovou džungli v přehlednou mapu. Zjistěte, jak s pomocí ikon zjednodušit navigaci, zvýraznit klíčové informace a proměnit suchá data v poutavý příběh. Naučte se vybírat vhodné ikony, pracovat s nimi efektivně a odhalte, proč je jejich správné použití klíčové pro srozumitelnost a úspěch vašich reportů.

Jak předvídat chování zákazníků: Churn, životní hodnota a další klíčové ukazatele | Mňamka #542

Jak předvídat chování zákazníků: Churn, životní hodnota a další klíčové ukazatele | Mňamka #542

Porozumění chování zákazníků a jeho predikce jsou dnes klíčové pro firmy, které chtějí budovat loajalitu, zlepšit cílení kampaní a efektivně řídit své marketingové investice. Jak předpovědět, kdy zákazník odejde, jakou má pro firmu hodnotu nebo kdy s největší pravděpodobností znovu nakoupí? V článku se podíváme na klíčové koncepty, jako je predikce odchodu zákazníků (churn), výpočet jejich životní hodnoty (Lifetime Value), odhad pravděpodobnosti další interakce či modelování sklonu k nákupu. Získané poznatky mohou pomoci vytvářet efektivnější marketingové strategie a lepší zákaznickou zkušenost.