Myslete na dataře už při tvorbě databáze | Mňamka #243

Pořád dokola potkáváme čtyři zádrhely, které se objevují v databázích u klientů. Velmi často tyhle “patterny” vedou k velkým problémům, frustraci a ve finále prodražují celý projekt. Pojďme si je projít.

1. Ta data jsme smazali

Možná Vám to přijde úsměvný, mně je ale spíš do breku. 

“prosímvás a ty historický data, máte to někde”“nemáme, smazali jsme je” …

Proč? Protože objem. Ano je to tak, ještě dnes se setkáváme s tím, že někdo třeba stará data zagreguje a smaže zdroj. Takže když chcete zpětně něco projít nebo dopočítat, máte smůlu. Dneska, kdy existuje 1000 a jedna služba na zálohování dat, a cloud úložiště stojí jednotky dolarů měsíčně… nedělejte to! 

 

2. K čemu historizovat?

Představte si, že měníte nějakou nabídku, položky v ceníku. Nění špatný si je do databáze uložit k danému dni, nebo držet historii změn. Je totiž možné, že se dostanete do situace, kdy na tyhle položky jsou navázané nějaké další položky a dost se do věcí zamotáte. V lepším případě to nějak rozmotáte, ale historii, pokud prostě k “danému idčku” přepíšete hodnotu, tu už nikdy nedohledáte...  
 

3. Total_price

Konečně. Moje nejoblíbenější eshopařská libůstka.

Dostávám odpověď na otázku “jak spočítám obrat?”. Chytám se za hlavu. Zase. Je to tam. Ten sloupec v databázi, o kterém většinou eshopaři tvrdí, že “je v něm všechno”, ve skutečnosti s ním neuděláte nic. Jmenuje se většinou total_price nebo nějak podobně. A co že je to za sloupec? No v něm je přece všechno! Je tam obrat. Jednoduchý jako facka. 

Jenže ve skutečnosti vůbec. To, že někdo obří “ify-věží” v kódu spočítal správně obrat taky mimo jiné znamená, že vůbec nevíte, jak naložil se slevama, dopravou, vratkama, dph … což je většinou to, co chcete, když analyzujete data. Chcete jednoduše filtrovat, porovnávat, započítat nebo nezapočítat. 

Vývojáři to tak určitě mysleli dobře, chtěli ušetřit práci, ale ve finále je to naopak. Samozřejmě, ruku na srdce, zdokumentovali to? … Když ne, nezbyde Vám nic jinýho, než luštit “ify-věž”. 

 

4. Slevy kam se podíváš

Posledním tipem, jak pomoc analytikům v práci, je správně pracovat se slevama. Prosím, dávejte ceny jako položky na fakturu se záporným znaménkem. Usnadníte nám práci. Dost často si totiž jednu slevu uložíte na fakturu, další na položku, další někam jinam a ve finále máte nějaké ty slevové kódy v jiné tabulce a s těmi se samozřejmě taky počítá… obloukem se tak vracíme k magickému total_price sloupečku… 

Myslete na nás! :)

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Jirka Tobolka
datový detektiv
LinkedIn

Datové sklady, jezera a lakehouse: Jak vybrat správnou architekturu pro správu dat? | Mňamka #533

Datové sklady, jezera a lakehouse: Jak vybrat správnou architekturu pro správu dat? | Mňamka #533

Svět správy dat prošel rychlým vývojem, který je poháněn rostoucí potřebou zpracovávat a analyzovat obrovské množství dat v reálném čase. Firmy, které chtějí porozumět svým datům, narazily na různé architektury – datové sklady, datová jezera a nyní i tzv. lakehouse – které nabízejí různé možnosti pro ukládání a správu dat. Tento článek se zabývá těmito třemi architekturami, porovnává jejich výhody a nevýhody a podrobněji se zaměřuje na lakehouse, nejnovější inovaci, která se snaží řešit problémy z dřívějších systémů.

Microsoft Fabric a jeho uživatelské rozhraní | Mňamka #532

Microsoft Fabric a jeho uživatelské rozhraní | Mňamka #532

Mircosoft Fabric je komplexní datová platforma, která má intuitivním grafické rozhraní, je však vhodná pro začínající i zkušené datové analytiky. Nabízí nástroje jako Data Factory pro zpracování dat, Power BI pro vizualizace a integraci s Git pro DevOps. Přestože je Fabric stále ve vývoji a některé funkce jsou v režimu "preview", jeho hlavní výhodou je přímá integrace vizualizací do jednoho prostředí. Pojďme si detailně projít jeho uživatelské prostředí, sepsali jsme pro vás základní přehled.

Jak se pracuje s Microsoft Fabric | Mňamka #531

Jak se pracuje s Microsoft Fabric | Mňamka #531

Microsoft Fabric slibuje revoluci ve zpracování dat ve firmách tím, že zefektivňuje správu dat a umožňuje připravovat, analyzovat a vizualizovat data bez nutnosti používat více oddělených systémů. Teorie zní skvěle, ale jaká je realita, když se rozhodnete tento nový "švýcarský nůž" pro práci s daty implementovat a používat? Podívejme se na to, jak se s Microsoft Fabric pracuje, s jakými výzvami se můžete setkat a jak rychle se stanete odborníkem na tuto platformu.