Design Pattern #5: Transakční data | Mňamka #165

Transakční data jsou všude kolem nás. Položka objednávky eshopu, nákup v obchodě… jak s nimi “zacvičit” tak, abychom se nemuseli dřív nebo později vracet do transformace a přidávat požadovaný sloupec. Mrkněte na věci, které děláme automaticky… Proč? Protože věřte, že brzo na ně dojde řada.

1. First = yes / no

První výskyt události v datech vždy označíme. Jedná se o první objednávku zákazníka? Označíme ji first_order atributem.

Proč? Pokud si data takto předpřipravíme, vyhneme se tak zbytečně složitým výpočtům. Typicky se hodí pro počty nových zákazníků za určité období (suma first_order sloupce za toto období) a podobně.

2. Datum pro jednotlivé stavy

Změnu stavu objednávky/leadu a podobně zaznamenáváme pomocí datumových sloupců pro jednotlivé stavy. Pro každý stav, který může nastat, existuje samostatný sloupec. Např. objednávka přijatá, expedovaná, uzavřená a další.

Proč? Snadno tak vyhneme zmatku, kdyz se atribut stav mění v rámci jednoho sloupce. Navíc můžeme pro každý záznam snadno sledovat dobu trvání konkrétního stavu. Alternativou je podřízená tabulka s jednotlivými objednávky a datem. Obě řešení můžeme i zkombinovat, podle toho, co je pro daný use case nejvýhodnější.

3. Transpozice ze “sloupečků” na samostatné “řádky”

Typicky používáme pro slevy, dopravu a služby, storno. Ze slev na faktuře vyrobíme samostatný řádek (položku faktury se zápornou cenou). Stejně postupujeme v případě storna nebo dopravy a dalších služeb. A co taková sleva prostřednictvím slevového kupónu na dané objednávce? Jasně, další řádek! 

Proč? Místo sčítání a odčítání hodnot v různých sloupcích při výpočtu tržeb, sčítáme jeden sloupec a snadno filtrujeme, jaký typ položek chceme do tržeb zahrnout. Pro zachování referenční integrity doplníme takto vzniklé položky do nadřízené tabulky (např. dopravu od konkrétního dodavatele do tabulky zboží).

Hodně eshopařů rádo vytváří sloupec kde “je všechno”, ten se většinou jmenuje “total price” … nenechte se zmást. Vyplatí se dát si tu práci a celý proces rozklíčovat a následně si vytvořit jednoduché položky, přes které můžete filtrovat. Ve finále si ušetřítě hromadu starostí ve vizualizaci.

Máte nějaký další tip, který děláte “vždycky a všude”? 

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Petra Horáčková
datový detektiv
LinkedIn

UI/UX case study v analýze sentimentu | Mňamka #341

UI/UX case study v analýze sentimentu | Mňamka #341

Už jste se někdy zajímali o to jak lidé vaši značku vnímají? A pokud ano, využili jste k tomu data a postavili si na to dashboard? Že ne? Tak se pojďte podívat na případovku z Indonésie na nejmenované zdravotní organizaci. Autor nás provede celým procesem od výzkumu po realizaci.

Proč mít datový katalog? | Mňamka #340

Proč mít datový katalog? | Mňamka #340

Slovní spojení jako Datová kultura, datová inteligence atd. buď od nás anebo někde z internetů dávno znáte. Jak je ve společnosti co nejjednodušeji etablovat? Pomoci s tímto problémem by mohl takzvaný datový katalog. Pojďte se dozvědět co to je a proč je tak důležitou součástí datové infrastruktury mnoha firem.

Multi-barevné vizualizace a jak na ně | Mňamka #339

Multi-barevné vizualizace a jak na ně | Mňamka #339

Před barvami už jsme párkrát varovali, to ale neznamená, že občas nenarazíme na report (třeba v e-commerce), který se tváří jako firemní logo v červnu. To může vést k mentální únavě a vizuálnímu přetížení publika, což žádný datový detektiv nechce. V článku se dozvíte na co si dávat pozor a jakou alternativu u různých typů grafů zvolit.