Je to mezera, není to mezera? | Mňamka #370

O čištění dat a jeho významu už jsme toho napsali poměrně hodně. Jednoduše řečeno - bez úklidu na vstupu budeme mít bordel i na výstupu.

Dokonce na to máme appku (Cooltivator), která tuhle mravenčí práci umí výrazně zjednodušit. :)

Co ale dělat, když potřebujeme “přechroustat” finanční čísla (například nějaký mapovací Google sheet s budgety)? Ono totiž jeden budget můžete napsat několika způsoby - a reálně se to i stává - copy & paste a najednou tam máte nový formát. :)

Třeba takhle:

Ale co s tím? Čistící skript by měl být univerzální a umět ošetřit všechny tyto možnosti.

Vezměme si to na příkladu Snowflake SQL a pěkně postupně:

1. “číslo” - pohodička, tady není o čem

2. “finanční” - tady už nám TO_NUMBER() stačit nebude - musíme nejdřív nahradit mezery a desetinnou čárku a až poté převést na číslo – rozehříváme se :)

3. “měna” - musíme navíc vyhodit “Kč”, vyzkoušíme

“Oops.. co se děje?” říkal jsem si, když jsem to viděl poprvý a zkusil to dvakrát znovu - chyba mezi klávesnicí a židlí? Není, ani napotřetí to neprošlo... Po chvíli googlení a zkoušení mi to došlo.

Poznáte rozdíl? :)

Ne? Já taky ne, až tady je vidět:

Zatímco v prvním případě jsme nahrazovali znak mezery, v tom druhém jde o oddělovač tisíců, což sice vizuálně vypadá úplně stejně, ale jde o jiný znak.

Takže:

Voilá - funguje! :)

Zapomněl jsem na něco? Chcete se na něco zeptat? Napište mi. 

Petr

Petr Koza
datový detektiv
LinkedIn

Jak na dashboardy | Mňamka #375

Jak na dashboardy | Mňamka #375

Dashboardy jsou jedním z nejdůležitějších komunikačních nástrojů v datovém světě. Na jejich základě je možné činit optimální firemní rozhodnutí a umožňují také snadnou orientaci v neustále se zvyšující záplavě dat. Aby ale takový dashboard plnil svůj účel, musí být jednoduše stravitelný pro své cílové publikum. Jiné informace totiž potřebuje exekutivní vedení firmy a jiné zase analytik zabývající se řešením konkrétní byznys otázky. Dnes vám proto přinášíme přehledný checklist, který vám pomůže s tvorbou vašich budoucích dashboardů!

E-commerce v post-covidové době | Mňamka #374

E-commerce v post-covidové době | Mňamka #374

Pro e-commerce se koronavirus stal doslova raketovým pohonem. Mnoho tradičních značek zamířilo narychlo online a některé obchody zažívaly dvou i trojciferné nárůsty tržeb. Nyní už ale stojíme před zcela jinou realitou. Koneckonců i česká e-shopová scéna není poprvé v historii na vzestupu, ale naopak stagnuje či dokonce klesá. Spousta firem proto aktuálně řeší otázku, jak co nejlépe skloubit online prodej s tradiční pobočkovou sítí. Odpověď lze samozřejmě najít ve využití dat, AI a prediktivní analytiky. O tom už ale více v dnešním článku!

Jak přistupovat k user managementu v datové analytice? | Mňamka #373

Jak přistupovat k user managementu v datové analytice? | Mňamka #373

Ne každý ve firmě by měl mít přístup úplně ke všem datům. A to ani tam, kde naplno vládne datová demokratizace. Základem dobré bezpečnosti je totiž tzv. princip nejnižších privilegií – nedávejte uživatelům přístup tam, kam ho nepotřebují. Stejně tak je ale potřeba pro klíčové procesy nastavit odpovídající kontrolní mechanismy, které povedou k minimalizaci bezpečnostních rizik. Co dalšího ještě můžete udělat? Verča pro vás popsala 5 důležitých bodů, kterých se společně s našimi klienty při přidělování uživatelských přístupů a práv snažíme držet.