Myslete na dataře už při tvorbě databáze | Mňamka #243

Pořád dokola potkáváme čtyři zádrhely, které se objevují v databázích u klientů. Velmi často tyhle “patterny” vedou k velkým problémům, frustraci a ve finále prodražují celý projekt. Pojďme si je projít.

1. Ta data jsme smazali

Možná Vám to přijde úsměvný, mně je ale spíš do breku. 

“prosímvás a ty historický data, máte to někde”“nemáme, smazali jsme je” …

Proč? Protože objem. Ano je to tak, ještě dnes se setkáváme s tím, že někdo třeba stará data zagreguje a smaže zdroj. Takže když chcete zpětně něco projít nebo dopočítat, máte smůlu. Dneska, kdy existuje 1000 a jedna služba na zálohování dat, a cloud úložiště stojí jednotky dolarů měsíčně… nedělejte to! 

 

2. K čemu historizovat?

Představte si, že měníte nějakou nabídku, položky v ceníku. Nění špatný si je do databáze uložit k danému dni, nebo držet historii změn. Je totiž možné, že se dostanete do situace, kdy na tyhle položky jsou navázané nějaké další položky a dost se do věcí zamotáte. V lepším případě to nějak rozmotáte, ale historii, pokud prostě k “danému idčku” přepíšete hodnotu, tu už nikdy nedohledáte...  
 

3. Total_price

Konečně. Moje nejoblíbenější eshopařská libůstka.

Dostávám odpověď na otázku “jak spočítám obrat?”. Chytám se za hlavu. Zase. Je to tam. Ten sloupec v databázi, o kterém většinou eshopaři tvrdí, že “je v něm všechno”, ve skutečnosti s ním neuděláte nic. Jmenuje se většinou total_price nebo nějak podobně. A co že je to za sloupec? No v něm je přece všechno! Je tam obrat. Jednoduchý jako facka. 

Jenže ve skutečnosti vůbec. To, že někdo obří “ify-věží” v kódu spočítal správně obrat taky mimo jiné znamená, že vůbec nevíte, jak naložil se slevama, dopravou, vratkama, dph … což je většinou to, co chcete, když analyzujete data. Chcete jednoduše filtrovat, porovnávat, započítat nebo nezapočítat. 

Vývojáři to tak určitě mysleli dobře, chtěli ušetřit práci, ale ve finále je to naopak. Samozřejmě, ruku na srdce, zdokumentovali to? … Když ne, nezbyde Vám nic jinýho, než luštit “ify-věž”. 

 

4. Slevy kam se podíváš

Posledním tipem, jak pomoc analytikům v práci, je správně pracovat se slevama. Prosím, dávejte ceny jako položky na fakturu se záporným znaménkem. Usnadníte nám práci. Dost často si totiž jednu slevu uložíte na fakturu, další na položku, další někam jinam a ve finále máte nějaké ty slevové kódy v jiné tabulce a s těmi se samozřejmě taky počítá… obloukem se tak vracíme k magickému total_price sloupečku… 

Myslete na nás! :)

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Jirka Tobolka
datový detektiv
LinkedIn

Dataři: Kdo jsme a jak už si nás mezi sebou neplést | Mňamka #526

Dataři: Kdo jsme a jak už si nás mezi sebou neplést | Mňamka #526

Jaké role můžete poznat v oblasti datové analýzy? Role jako je např. datový inženýr, datový analytik a datový vědec, a jaká je jejich funkce a proč je důležité rozlišovat mezi těmito profesemi? Vysvětlíme, jak každá z těchto rolí přispívá k Business Intelligence a jaké jsou jejich klíčové rozdíly.

Data Storytelling: Rychlé vs Pomalé datové myšlení | Mňamka #525

Data Storytelling: Rychlé vs Pomalé datové myšlení | Mňamka #525

Znáte ten pocit, když se už několik desítek minut hrabete ve složité tabulce a stále nemůžete najít odpovědi na svoje otázky? My už dávno ne. Umíme si totiž najít zkratku z pomalého myšlení do toho rychlého.

Keboola a Kai PromtLab | Mňamka #524

Keboola a Kai PromtLab | Mňamka #524

Objavte PromptLab, sofistikované riešenie od Kebooly a Kai PromtLab na zlepšenie interakcií s umelou inteligenciou. V tomto článku sa dozviete, ako PromptLab využíva technológiu Streamlit na automatické prispôsobovanie výziev za účelom dosiahnutia lepšej jasnosti a presnosti vo vašich projektoch. Oboznámte sa s intuitívnym rozhraním, ktoré vám umožní porovnávať výsledky a optimalizovať pracovné postupy.