Je to mezera, není to mezera? | Mňamka #370

O čištění dat a jeho významu už jsme toho napsali poměrně hodně. Jednoduše řečeno - bez úklidu na vstupu budeme mít bordel i na výstupu.

Dokonce na to máme appku (Cooltivator), která tuhle mravenčí práci umí výrazně zjednodušit. :)

Co ale dělat, když potřebujeme “přechroustat” finanční čísla (například nějaký mapovací Google sheet s budgety)? Ono totiž jeden budget můžete napsat několika způsoby - a reálně se to i stává - copy & paste a najednou tam máte nový formát. :)

Třeba takhle:

Ale co s tím? Čistící skript by měl být univerzální a umět ošetřit všechny tyto možnosti.

Vezměme si to na příkladu Snowflake SQL a pěkně postupně:

1. “číslo” - pohodička, tady není o čem

2. “finanční” - tady už nám TO_NUMBER() stačit nebude - musíme nejdřív nahradit mezery a desetinnou čárku a až poté převést na číslo – rozehříváme se :)

3. “měna” - musíme navíc vyhodit “Kč”, vyzkoušíme

“Oops.. co se děje?” říkal jsem si, když jsem to viděl poprvý a zkusil to dvakrát znovu - chyba mezi klávesnicí a židlí? Není, ani napotřetí to neprošlo... Po chvíli googlení a zkoušení mi to došlo.

Poznáte rozdíl? :)

Ne? Já taky ne, až tady je vidět:

Zatímco v prvním případě jsme nahrazovali znak mezery, v tom druhém jde o oddělovač tisíců, což sice vizuálně vypadá úplně stejně, ale jde o jiný znak.

Takže:

Voilá - funguje! :)

Zapomněl jsem na něco? Chcete se na něco zeptat? Napište mi. 

Petr

Petr Koza
datový detektiv
LinkedIn

BI + generativní AI = Analytika na steroidech | Mňamka #549

BI + generativní AI = Analytika na steroidech | Mňamka #549

Jak GPT a spol. mění roli analytiků? Konverzace s daty, automatické vizualizace i predikce. Ještě nedávno jsme o umělé inteligenci mluvili spíš jako o budoucnosti. Dnes je generativní AI všude, od psaní textů přes tvorbu obrázků až po generování kódu. A během posledních měsíců začala výrazně měnit i oblast business intelligence. Firmy po celém světě zjišťují, že generativní modely dokážou zjednodušit práci s daty a zároveň ji zpřístupnit lidem, kteří nejsou datoví analytici.

Certifikace Fabric DP-600: Co mi přinesla a proč je přínosná i pro naše klienty | Mňamka #548

Certifikace Fabric DP-600: Co mi přinesla a proč je přínosná i pro naše klienty | Mňamka #548

Certifikace Fabric DP-600 je čerstvě v kapse! 🎓 V naší konzultační praxi se stále více soustředíme na řešení v Microsoft Fabric, které integruje datovou analýzu, inženýrství i vizualizace. Ráda bych se s vámi podělila o své zkušenosti a ukázala, proč tato certifikace není jen o nových znalostech, ale hlavně o přidané hodnotě pro vás, naše klienty. Zjistěte, jak mi pomohla získat hlubší porozumění celému ekosystému a odemknout jeho plný potenciál.

Jak data mění firmy: zkušenosti z byznysových rozhovorů | Mňamka #547

Jak data mění firmy: zkušenosti z byznysových rozhovorů | Mňamka #547

„A k čemu nám to vlastně bude?“ To je otázka, kterou v datových projektech slyšíme nejčastěji. A správná odpověď se nehledá v tabulkách nebo dashboardech, ale přímo u lidí, kteří rozhodují. Právě v rozhovorech se rodí skutečná byznysová hodnota. Proč bez rozhovorů projekty selhávají? Praxe nám několikrát ukázala, že bez byznysových rozhovorů, které jdou do hloubky, jde pouze o drahé cvičení bez měřitelného dopadu.