Warehouse
Datové sklady, jezera a lakehouse: Jak vybrat správnou architekturu pro správu dat? | Mňamka #533
Svět správy dat prošel rychlým vývojem, který je poháněn rostoucí potřebou zpracovávat a analyzovat obrovské množství dat v reálném čase. Firmy, které chtějí porozumět svým datům, narazily na různé architektury – datové sklady, datová jezera a nyní i tzv. lakehouse – které nabízejí různé možnosti pro ukládání a správu dat. Tento článek se zabývá těmito třemi architekturami, porovnává jejich výhody a nevýhody a podrobněji se zaměřuje na lakehouse, nejnovější inovaci, která se snaží řešit problémy z dřívějších systémů.
Nový způsob transformace dat: Co to je dbt | Mňamka #129
Slyšeli jste už o dbt? Tahle pecka dokáže ulehčit práci nejednoho datového analytika. Jde o open source, který teď hodně testujeme a nemůžeme si ho vynachválit. Uvnitř článku najdete o krátké video od našeho CTO Toma.
Životní cyklus dat a proč nic nevynechat | Mňamka #106
Často na prvních schůzkách řešíme požadavek napojení vyexportovaného CSV přímo na vizualizační nástroj… Teoreticky to jde, ale existují pádné důvody, proč to tak nedělat. Pojďme si dnes projít, co se děje s daty v jejich životním cyklu a hlavně proč je každá fáze tolik důležitá.
Jak na optimalizaci výkonu v BigQuery | Mňamka #86
Ten, kdo začíná s BigQuery, bývá zpravidla překvapený, že BigQuery sama neposkytuje žádné přímé možnosti, jak vývojář může ovlivnit výkon či rychlost zpracování. Transakční databáze používají indexy, analytické databáze zase např. způsob, jak je výpočet paralelizován (pomocí uživatelem definovaného partitioningu), či může přímo ovlivnit výkon zakoupeným výkonem. BigQuery nic takového nemá a proto někdy začátečníky odrazuje. Ale i zde existuje celá řada způsobů, jak optimalizovat výkon konkrétních queries. Máme tady pro vás pár tipů.
Keboola ZADARMO? Jasně, jde to. | Mňamka #85
Asi před dvěma lety se Keboola vydala vstříc vysněnému enterprise segmentu a tomu bohužel přizpůsobila i svůj ceník. O to víc jsme rádi, že po delší době se vrací ke svým kořenům - malým a středním firmám - a pro SMB spouští pay-as-you-go program, který zpřístupňuje “kábécéčko” opravdu každému týmu a umožňuje začít doslova zadarmo. Jaké jsou první dojmy?
Snowflake, BigQuery nebo Redshift? Tak nevím… | Mňamka #36
Vybíráte analytickou databázi pro váš tým nebo BI projekt? Už jste přečetli všechny dostupné články, srovnání, testy, benchmarky a stejně si nejste jisti volbou? Dokonce jste všechny jmenované zástupce i vyzkoušeli a stále není jasné, jaký SQL warehouse pro váš tým je ten pravý? S dovolením nabízíme malé srovnání pohledem pětileté praxe našeho týmu.