Nový způsob transformace dat: Co to je dbt | Mňamka #129
Máme technologie, které milujeme, máme je odzkoušené a umíme je. To ale rozhodně neznamená, že stále netestujeme nové. A tak jsme narazili na dbt (Data Build Tool) - open source, který nás hodně baví.
Než si řekneme víc, pojďme o krok zpět. Máme data ve zdrojových systémech a ve finále se na ně potřebujeme koukat třeba v nějakém vizualizačním nástroji. Ale než se podíváme na pěkný grafíky a rozjedeme naplno business intelligence, musíme ujít ještě dlouhou cestu (který datový analytik by neznal, že...). No a ta cesta je zjednodušeně v zásadě dvojí. Buď si data vezmeme ze zdrojového systému (extract), cestou v nich uklidíme (transform) a upravené je natáhneme do cíle (třeba cílový data warehouse) = ETL (na to se dá využít například nástroj Keboola nebo si to můžeme postavit na cloudových službách), nebo je ze zdrojového systému vytáhneme tak jak jsou a ten úklid děláme až v cíli, plus často až když je potřeba = ELT.
Co to je dbt?
Je to nástroj, který se v ELT stará o to “T”. Základem je projekt, který se konfiguruje sadou YAML souborů a SQL souborů s makry.

Zdroj obrázku: https://blog.getdbt.com/what--exactly--is-dbt-/
V čem je jeho kouzlo?
Tím, že dbt podporuje makra v SQL spojuje silu skriptovacího jazyka Python a SQL. Umožňuje používat cykly pro generování SQL, takže minimalizuje kopírování kódu. Automatické testování - stačí popsat, jak mají vypadat data, která vystupují z transformace, a dbt se postará o to, že to tak fakt je.
Prostě kouzlo dbt je v tom, že k tomu “T” přistupuje tak, že se snaží usnadňovat věci, který jsou často třeba a je nutný je řešit opakováním kódu, případně kódem, kterej je náchylnej k chybám. V případě, že se něco změní v datech, transformace s dbt se dají napsat tak, že to dbt buď pozná a řekne, že je něco špatně, nebo na to bude připravený a zařídí, že se nestane nic špatného.
A mimojiné - je to opensource s velmi snadnou instalací. Správa kódu v gitu, která podporuje CI/CD principy a spolupráci týmu na projektu. Dá se integrovat do existující pipeline, de facto poběží všude, kde běží Python.
Za nás je to pecka. Chcete vědět víc? Mrkněte výše na Tomovo video.
Zapomněla jsem na něco? Chcete se na něco zeptat? Napište mi.
Eva
BI + generativní AI = Analytika na steroidech | Mňamka #549
Jak GPT a spol. mění roli analytiků? Konverzace s daty, automatické vizualizace i predikce. Ještě nedávno jsme o umělé inteligenci mluvili spíš jako o budoucnosti. Dnes je generativní AI všude, od psaní textů přes tvorbu obrázků až po generování kódu. A během posledních měsíců začala výrazně měnit i oblast business intelligence. Firmy po celém světě zjišťují, že generativní modely dokážou zjednodušit práci s daty a zároveň ji zpřístupnit lidem, kteří nejsou datoví analytici.
Certifikace Fabric DP-600: Co mi přinesla a proč je přínosná i pro naše klienty | Mňamka #548
Certifikace Fabric DP-600 je čerstvě v kapse! 🎓 V naší konzultační praxi se stále více soustředíme na řešení v Microsoft Fabric, které integruje datovou analýzu, inženýrství i vizualizace. Ráda bych se s vámi podělila o své zkušenosti a ukázala, proč tato certifikace není jen o nových znalostech, ale hlavně o přidané hodnotě pro vás, naše klienty. Zjistěte, jak mi pomohla získat hlubší porozumění celému ekosystému a odemknout jeho plný potenciál.
Jak data mění firmy: zkušenosti z byznysových rozhovorů | Mňamka #547
„A k čemu nám to vlastně bude?“ To je otázka, kterou v datových projektech slyšíme nejčastěji. A správná odpověď se nehledá v tabulkách nebo dashboardech, ale přímo u lidí, kteří rozhodují. Právě v rozhovorech se rodí skutečná byznysová hodnota. Proč bez rozhovorů projekty selhávají? Praxe nám několikrát ukázala, že bez byznysových rozhovorů, které jdou do hloubky, jde pouze o drahé cvičení bez měřitelného dopadu.