ETL

Extrakce/získávání dat – jak na to? | Mňamka #376

Extrakce/získávání dat – jak na to? | Mňamka #376

V současné době bývá poměrně běžné, že se firemní data nacházejí v mnoha různých nesourodých zdrojích – v CRM a ERP systémech, účetních programech, online inzertních platformách nebo na webových stránkách. Pokud taková data chcete využít pro datovou analytiku, musíte je nejprve extrahovat do vaší databáze či datového skladu. V drtivé většině případů to je proveditelné, potřebujete k tomu ale speciální program, tzv. extraktor. Jak takové programy vlastně fungují a co dělat, pokud potřebujete stahovat data ze stránky, která nemá API? To už se dozvíte v mňamce od Báry!

Rozdílné přístupy v transformaci dat - ETL / ELT | Mňamka #295

Rozdílné přístupy v transformaci dat - ETL / ELT | Mňamka #295

Máme tady další in-house článek od datových detektivů. Tentokrát se budeme bavit o ETL versus ELT! Emil sepsal přehledný text o tom jaké mají oba způsoby práce s daty pro a proti. Chcete vědět který z těchto dvou úhlů pohledu na práci s daty je pro vás lepší? Po tomhle srovnání byste měli mít jasno do čeho se pustíte.

Jak spojit dvě tabulky když… | Mňamka #252

Jak spojit dvě tabulky když… | Mňamka #252

Možná to taky znáte. Máte dvě nebo více tabulek, které potřebujete spojit a dál s nimi pracovat. To zní jednoduše, jenže v praxi se můžeme zaseknout na spoustě detailů. Tabulky můžou být různé, mohou mít různé formáty, mohou být obsahově jiné - mají jiný počet nebo jiné názvy sloupců, nedejbože i jiné datové typy, duplikace, překlepy, chybějící hodnoty atd… To je běžná realita. Pojďme se podívat na to, jak si poradit v pěti klasických příkladech, se kterými se můžete setkat, když se pustíte do spojování tabulek! Vše stručně a jasně!

Logika data warehousu a data martu | Mňamka #207

Logika data warehousu a data martu | Mňamka #207

Když začneme řešit data, hned na začátku je fajn položit si základní otázku: v jaké podobě mít svá data uložená tak, abychom je mohli skutečně efektivně používat pro řízení svého byznysu? Jedním z možných řešení je vytvořit tzv. data warehouse, popř. data marts. Co to je? Jaké mají vlastnosti? Co by měli umět? Jaké využíváme přístupy k data warehousingu? Cloud nebo on-premise? Kuba to všechno v kostce sepsal!

Automatizace, aneb když Excel nestačí | Mňamka #189

Automatizace, aneb když Excel nestačí | Mňamka #189

Když se řekne automatizace, vyvolá to v lidech často rozporuplné pocity. Jedni jásají, druzí se začnou pomalu bát o své místo. Je fajn se na to podívat z více úhlů pohledu. Trocha automatizace vám může jak mávnutím kouzelného proutku rozvázat ruce. Představte si, že ty čtyři hodiny, kdy jsou vašimi nerozlučnými parťáky tři klávesy „ctrl“, „céčko“ a „véčko“, můžete věnovat něčemu opravdu smysluplnému! Co si představit pod pojmem automatizace? Jaké jsou její výhody a kam může firmy posunout? Jak celý proces nastavit a jak automatizovat pomocí ETL pipeline? Všechno info zde!

DBT vs. Dataform | Mňamka #177

DBT vs. Dataform | Mňamka #177

DBT a Dataform – dvě hodně podobné technologie, které vám dokážou pomoci s transformací dat v rámci ELT přístupu. Pro spoustu use cases skvělá věc! Obě technologie mají mnoho společného. V čem vede Dataform a v čem má navrch DBT? Verča si na to posvítila!