Zpracování dat - integrace a transformace

Logika data warehousu a data martu | Mňamka #207

Logika data warehousu a data martu | Mňamka #207

Když začneme řešit data, hned na začátku je fajn položit si základní otázku: v jaké podobě mít svá data uložená tak, abychom je mohli skutečně efektivně používat pro řízení svého byznysu? Jedním z možných řešení je vytvořit tzv. data warehouse, popř. data marts. Co to je? Jaké mají vlastnosti? Co by měli umět? Jaké využíváme přístupy k data warehousingu? Cloud nebo on-premise? Kuba to všechno v kostce sepsal!

DBT vs. Dataform | Mňamka #177

DBT vs. Dataform | Mňamka #177

DBT a Dataform – dvě hodně podobné technologie, které vám dokážou pomoci s transformací dat v rámci ELT přístupu. Pro spoustu use cases skvělá věc! Obě technologie mají mnoho společného. V čem vede Dataform a v čem má navrch DBT? Verča si na to posvítila!

Když vidím dataset poprvé| Mňamka #174

Když vidím dataset poprvé| Mňamka #174

Máte na stole nový dataset. Kde začít, abyste svou datovou analýzu postavili na kvalitních základech? Patrikovi už nějaký ten dataset rukama prošel a dal dohromady své best practices!

Design Pattern #5: Transakční data | Mňamka #165

Design Pattern #5: Transakční data | Mňamka #165

Transakční data si asi umí představit každý. Hromada řádků z eshopu, to je přece jasný. Spočítat revenue je přece hračka... jenže pak to přijde. Na každý řádek jiná sleva, jinak datum, teď které datum?, slevy na položku, slevy na fakturu, slevový kupón, s dopravou nebo bez? a tak dále. Denní chléb datového detektiva. Skvěle vám poslouží tyto tři designové patterny, které usnadní zpracování transakčních dat. Stačí se zorientovat v databázi!

Nový způsob transformace dat: Co to je dbt | Mňamka #129

Nový způsob transformace dat: Co to je dbt | Mňamka #129

Slyšeli jste už o dbt? Tahle pecka dokáže ulehčit práci nejednoho datového analytika. Jde o open source, který teď hodně testujeme a nemůžeme si ho vynachválit. Uvnitř článku najdete o krátké video od našeho CTO Toma.

Životní cyklus dat a proč nic nevynechat | Mňamka #106

Životní cyklus dat a proč nic nevynechat | Mňamka #106

Často na prvních schůzkách řešíme požadavek napojení vyexportovaného CSV přímo na vizualizační nástroj… Teoreticky to jde, ale existují pádné důvody, proč to tak nedělat. Pojďme si dnes projít, co se děje s daty v jejich životním cyklu a hlavně proč je každá fáze tolik důležitá.