Myslete na dataře už při tvorbě databáze | Mňamka #243

Pořád dokola potkáváme čtyři zádrhely, které se objevují v databázích u klientů. Velmi často tyhle “patterny” vedou k velkým problémům, frustraci a ve finále prodražují celý projekt. Pojďme si je projít.

1. Ta data jsme smazali

Možná Vám to přijde úsměvný, mně je ale spíš do breku. 

“prosímvás a ty historický data, máte to někde”“nemáme, smazali jsme je” …

Proč? Protože objem. Ano je to tak, ještě dnes se setkáváme s tím, že někdo třeba stará data zagreguje a smaže zdroj. Takže když chcete zpětně něco projít nebo dopočítat, máte smůlu. Dneska, kdy existuje 1000 a jedna služba na zálohování dat, a cloud úložiště stojí jednotky dolarů měsíčně… nedělejte to! 

 

2. K čemu historizovat?

Představte si, že měníte nějakou nabídku, položky v ceníku. Nění špatný si je do databáze uložit k danému dni, nebo držet historii změn. Je totiž možné, že se dostanete do situace, kdy na tyhle položky jsou navázané nějaké další položky a dost se do věcí zamotáte. V lepším případě to nějak rozmotáte, ale historii, pokud prostě k “danému idčku” přepíšete hodnotu, tu už nikdy nedohledáte...  
 

3. Total_price

Konečně. Moje nejoblíbenější eshopařská libůstka.

Dostávám odpověď na otázku “jak spočítám obrat?”. Chytám se za hlavu. Zase. Je to tam. Ten sloupec v databázi, o kterém většinou eshopaři tvrdí, že “je v něm všechno”, ve skutečnosti s ním neuděláte nic. Jmenuje se většinou total_price nebo nějak podobně. A co že je to za sloupec? No v něm je přece všechno! Je tam obrat. Jednoduchý jako facka. 

Jenže ve skutečnosti vůbec. To, že někdo obří “ify-věží” v kódu spočítal správně obrat taky mimo jiné znamená, že vůbec nevíte, jak naložil se slevama, dopravou, vratkama, dph … což je většinou to, co chcete, když analyzujete data. Chcete jednoduše filtrovat, porovnávat, započítat nebo nezapočítat. 

Vývojáři to tak určitě mysleli dobře, chtěli ušetřit práci, ale ve finále je to naopak. Samozřejmě, ruku na srdce, zdokumentovali to? … Když ne, nezbyde Vám nic jinýho, než luštit “ify-věž”. 

 

4. Slevy kam se podíváš

Posledním tipem, jak pomoc analytikům v práci, je správně pracovat se slevama. Prosím, dávejte ceny jako položky na fakturu se záporným znaménkem. Usnadníte nám práci. Dost často si totiž jednu slevu uložíte na fakturu, další na položku, další někam jinam a ve finále máte nějaké ty slevové kódy v jiné tabulce a s těmi se samozřejmě taky počítá… obloukem se tak vracíme k magickému total_price sloupečku… 

Myslete na nás! :)

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Jirka Tobolka
datový detektiv
LinkedIn

Tableau - Performance Tuning (časť 3.) | Mňamka #506

Tableau - Performance Tuning (časť 3.) | Mňamka #506

Chcete vědět, jak zlepšit rychlost a efektivitu vašeho dashboardu v Tableau? Tento článek vás seznámí s významem materializace výpočtů, výhodami agregace dat a důležitostí specifikace datových zdrojů. Navíc se dozvíte o nové funkci "workbook optimizer", která vám nabídne automatizované doporučení pro dosažení optimálního výkonu vašeho dashboardu. Přečtěte si více a dozvíte se, jak dosáhnout rychlejšího a hladšího provozu vašich vizualizací v Tableau.

Tableau - Performance Tuning (časť 2.) | Mňamka #503

Tableau - Performance Tuning (časť 2.) | Mňamka #503

Dnes nadviažeme pokračovaním na minulotýžďnový článok a pozrieme na niektoré ďalšie možnosti zrýchlenia vašeho pomalého dashboardu. V prípade filtrov tiež platí, že pre performance je lepšie držať ich počet na uzde. Je to spôsobené tým, že načítanie hodnôt pre každý jeden interaktívny filter predstavuje jednu query. Negatívny vplyv na performance sa ešte umocňuje v prípade využitia možnosti “Only Relevant Values”.

Tableau - Performance Tuning (časť 1.) | Mňamka #500

Tableau - Performance Tuning (časť 1.) | Mňamka #500

Naimplementovali ste dashboard, vyhrali ste sa s vizuálom, čísla na vám sedia. Násadíte dashboard na Tableau server a idete ho otestovať, tu však narazíte na problém. Dashboard sa načítava extrémne dlho. Pre časovo vyťažený klienta, ktorý potrebuje mať dáta nie len správne, ale aj dostupné v rozumnom čase, je samozrejme takýto stav neakceptovateľný. Čo teraz? Určite nezúfajte, v tomto článku sa s vami podelíme o skúsenosti čo v takom prípade robiť.