Design Pattern #5: Transakční data | Mňamka #165

Transakční data jsou všude kolem nás. Položka objednávky eshopu, nákup v obchodě… jak s nimi “zacvičit” tak, abychom se nemuseli dřív nebo později vracet do transformace a přidávat požadovaný sloupec. Mrkněte na věci, které děláme automaticky… Proč? Protože věřte, že brzo na ně dojde řada.

1. First = yes / no

První výskyt události v datech vždy označíme. Jedná se o první objednávku zákazníka? Označíme ji first_order atributem.

Proč? Pokud si data takto předpřipravíme, vyhneme se tak zbytečně složitým výpočtům. Typicky se hodí pro počty nových zákazníků za určité období (suma first_order sloupce za toto období) a podobně.

2. Datum pro jednotlivé stavy

Změnu stavu objednávky/leadu a podobně zaznamenáváme pomocí datumových sloupců pro jednotlivé stavy. Pro každý stav, který může nastat, existuje samostatný sloupec. Např. objednávka přijatá, expedovaná, uzavřená a další.

Proč? Snadno tak vyhneme zmatku, kdyz se atribut stav mění v rámci jednoho sloupce. Navíc můžeme pro každý záznam snadno sledovat dobu trvání konkrétního stavu. Alternativou je podřízená tabulka s jednotlivými objednávky a datem. Obě řešení můžeme i zkombinovat, podle toho, co je pro daný use case nejvýhodnější.

3. Transpozice ze “sloupečků” na samostatné “řádky”

Typicky používáme pro slevy, dopravu a služby, storno. Ze slev na faktuře vyrobíme samostatný řádek (položku faktury se zápornou cenou). Stejně postupujeme v případě storna nebo dopravy a dalších služeb. A co taková sleva prostřednictvím slevového kupónu na dané objednávce? Jasně, další řádek! 

Proč? Místo sčítání a odčítání hodnot v různých sloupcích při výpočtu tržeb, sčítáme jeden sloupec a snadno filtrujeme, jaký typ položek chceme do tržeb zahrnout. Pro zachování referenční integrity doplníme takto vzniklé položky do nadřízené tabulky (např. dopravu od konkrétního dodavatele do tabulky zboží).

Hodně eshopařů rádo vytváří sloupec kde “je všechno”, ten se většinou jmenuje “total price” … nenechte se zmást. Vyplatí se dát si tu práci a celý proces rozklíčovat a následně si vytvořit jednoduché položky, přes které můžete filtrovat. Ve finále si ušetřítě hromadu starostí ve vizualizaci.

Máte nějaký další tip, který děláte “vždycky a všude”? 

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Petra Horáčková
datový detektiv
LinkedIn

Jak ohodnotit lokalitu: Data vs. Pocity | Mňamka #523

Jak ohodnotit lokalitu: Data vs. Pocity | Mňamka #523

V dnešním dynamickém světě se může zdát, že rozhodování o tom, kde otevřít další pobočku, je náročné, a že v něm hraje roli až příliš mnoho faktorů. Často kladené dotazy, které dostáváme, se točí kolem hodnocení potenciálu konkrétních lokalit. V tomto článku vám ukážeme, jak Location Intelligence může poskytnout přesné odpovědi na vaše otázky a zajistit, že vaše rozhodnutí budou založena na datech a faktech, nikoli na pocitech a zdánlivé atraktivitě místa.

 Rychlý porovnání: dbt cloud vs dbt core | Mňamka #522

Rychlý porovnání: dbt cloud vs dbt core | Mňamka #522

Data Build Tool, běžně známý jako dbt, se stal klíčovým prvkem v moderním datovém ekosystému. Jako kompilátor analytického SQL pomáhá dbt profesionálům z oblasti datové analýzy přeměnit surová data v datovém skladu na použitelné poznatky. Tento článek poskytne srovnání dvou klíčových nabídek: dbt Core a dbt Cloud.

Jak správně představit svůj daty podložený příběh?| Mňamka #521

Jak správně představit svůj daty podložený příběh?| Mňamka #521

Jak dostat cenné poznatky z obrovského množství dat a  informací?  Co dělat poté, co jste provedli analýzu a identifikovali významný trend? Jak efektivně sdílet tyto poznatky s ostatními? Kdo je vaše cílové publikum? Dalším a možná nejdůležitějším krokem je vyprávění.