Myslete na dataře už při tvorbě databáze | Mňamka #243

Pořád dokola potkáváme čtyři zádrhely, které se objevují v databázích u klientů. Velmi často tyhle “patterny” vedou k velkým problémům, frustraci a ve finále prodražují celý projekt. Pojďme si je projít.

1. Ta data jsme smazali

Možná Vám to přijde úsměvný, mně je ale spíš do breku. 

“prosímvás a ty historický data, máte to někde”“nemáme, smazali jsme je” …

Proč? Protože objem. Ano je to tak, ještě dnes se setkáváme s tím, že někdo třeba stará data zagreguje a smaže zdroj. Takže když chcete zpětně něco projít nebo dopočítat, máte smůlu. Dneska, kdy existuje 1000 a jedna služba na zálohování dat, a cloud úložiště stojí jednotky dolarů měsíčně… nedělejte to! 

 

2. K čemu historizovat?

Představte si, že měníte nějakou nabídku, položky v ceníku. Nění špatný si je do databáze uložit k danému dni, nebo držet historii změn. Je totiž možné, že se dostanete do situace, kdy na tyhle položky jsou navázané nějaké další položky a dost se do věcí zamotáte. V lepším případě to nějak rozmotáte, ale historii, pokud prostě k “danému idčku” přepíšete hodnotu, tu už nikdy nedohledáte...  
 

3. Total_price

Konečně. Moje nejoblíbenější eshopařská libůstka.

Dostávám odpověď na otázku “jak spočítám obrat?”. Chytám se za hlavu. Zase. Je to tam. Ten sloupec v databázi, o kterém většinou eshopaři tvrdí, že “je v něm všechno”, ve skutečnosti s ním neuděláte nic. Jmenuje se většinou total_price nebo nějak podobně. A co že je to za sloupec? No v něm je přece všechno! Je tam obrat. Jednoduchý jako facka. 

Jenže ve skutečnosti vůbec. To, že někdo obří “ify-věží” v kódu spočítal správně obrat taky mimo jiné znamená, že vůbec nevíte, jak naložil se slevama, dopravou, vratkama, dph … což je většinou to, co chcete, když analyzujete data. Chcete jednoduše filtrovat, porovnávat, započítat nebo nezapočítat. 

Vývojáři to tak určitě mysleli dobře, chtěli ušetřit práci, ale ve finále je to naopak. Samozřejmě, ruku na srdce, zdokumentovali to? … Když ne, nezbyde Vám nic jinýho, než luštit “ify-věž”. 

 

4. Slevy kam se podíváš

Posledním tipem, jak pomoc analytikům v práci, je správně pracovat se slevama. Prosím, dávejte ceny jako položky na fakturu se záporným znaménkem. Usnadníte nám práci. Dost často si totiž jednu slevu uložíte na fakturu, další na položku, další někam jinam a ve finále máte nějaké ty slevové kódy v jiné tabulce a s těmi se samozřejmě taky počítá… obloukem se tak vracíme k magickému total_price sloupečku… 

Myslete na nás! :)

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Jirka Tobolka
datový detektiv
LinkedIn

Průzkum: Business Intelligence v malých a středních firmách

Průzkum: Business Intelligence v malých a středních firmách

V několika minulých týdnech jsme se poměrně intenzivně věnovali zmapování situace v oblasti využívání Business Intelligence malými a středními firmami (SME) v ČR. Zajímala nás vyspělost trhu v této oblasti a to, jakým způsobem se zde projevují trendy demokratizace a decentralizace datové analytiky a přesunu vlivu od IT oddělení směrem k byznys uživatelům, jak to např. popisuje Gartner ve svém posledním vydání BI Magic Quadrantu. 

Stará dobrá eReFeM

Stará dobrá eReFeM

O RFM segmentaci napsal snad každý, kdo se zabývá datovou analýzou, segmentací zákazníků, využitím dat v marketingu apod. Jeden z nejlepších článků o tom, co to je, jak to funguje a k čemu všemu to může být dobré, najdete v Padákově deníčku - doporučuju, pokud se chcete s metodou lépe seznámit.

Datovej Woodstock 2018

Datovej Woodstock 2018

Před víc jak dvěma lety jsem na blogu psal o tom, jak moc nechodíme na hackathony, ale občas je spolupořádáme. Tentokrát jsme se ale pustili do akce násobně větší. Jak to dopadlo?