Design pattern #6: Události v datech | Mňamka #237

Máme tu další várku design patternů! Pojďme si ukázat, jak můžeme pracovat s událostmi v datech - zajímá vás, co předcházelo zákaznické registraci? Průměrný počet dní mezi objednávkami? Nebo jak se mění zdroj návštěv u jednotlivých klientů? Není to nic složitého!

1. Absolutní pořadí v rámci “partition” (např. klienta)

Typickým use casem pro tohle řešení je například analytika akvizičního “funnelu”, kdy sledujete jakým způsobem (a odkud) uživatel přicházel na Váš produktový web předtím, než se zaregistroval nebo udělal nákup. Může Vám to velmi pomoci v pochopení patternů chování jednotlivých zákazníků, nebo skupin, nebo třeba odhalit mezery v akvizičním procesu 

Podobně jako v případě “prvního výskytu” události, First = yes / no, můžeme očíslovat pořadí výskytu událostí v rámci jedné partition (např. 1., 2., 3. objednávka, návštěva webu apod. konkrétního zákazníka). 

Níže se můžete podívat na příklad konkrétního SQL (Snowflake), kterým se tohle řeší. Napadá Vás k čemu dalšímu by se tenhle vzor dal použít?

2. Days_since_previous jako fakt i sgroupovaný atribut

Dny od předchozí události, typicky objednávky, ukládáme jako fakt (počet dní) i jako zgroupovaný atribut (tj. uplynulo od poslední objednávky třeba měně než 7 dní, 14 dní, 30 dní, 90+ dní…). Případně mohou být kategoie disjunktní (0-7 dní, 8-14 dní...), záleží na konkrétním use-case.

Proč? Z počtu dní od poslední objednávky můžeme sledovat metriky jako průměrný počet dní mezi objednávkami. Přes sgupované atributy může uživatel snadno slicovat a sledovat chování zákazníků v jednotlivých kategoriích (např. nejvíce zákazníků udělá další objednávku jednou do měsíce, pokud se konkrétní zákazník posune do kategorie ‘90+ dní’, pravděpodobně ho firma ztratí...) Jedná se o typický use case, na který se hodí mít data připravená tak, aby si uživatel mohl snadno vytvářet reporty a metriky. Nehodí se jen pro e-shopy, ale třeba i pokud sledujeme návštěvnost libovolného webu a další use-cases.

Previous atributy

Previous atributy se typicky hodí pro vyhodnocení marketingových kampaní (např. zda se podařilo dostat návštěvníky z cpc do directu, nebo naopak, pokud přišli návštěvníci na web minule přímo a nyní přes placenou kampaň, je kampaň špatně zacílená...). V kombinaci s days_since_previous lze namodelovat celý acquisition funnel. V SQL spočítáme obdobně, pomocí window funkce LAG. Opět se jedná o typický use case.

Máte nějaký další tip, který děláte “vždycky a všude”? 

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Petra Horáčková
datový detektiv
LinkedIn

Jak dostat analytiku do produktu? | Mňamka #331

Jak dostat analytiku do produktu? | Mňamka #331

Máme tady další inhouse mňamku, tentokrát od našeho Jirky. Bude nám povídat o datové analytice v produktech. Přemýšleli jste už nad tím jak vašim klientům dopřát trochu toho přehledu v interních datech? A zajímá vás jak do produktu analytiku dostat co nejjednodušeji?

Kognitivní zkreslení: Heuristika dostupnosti a komár zabiják | Mňamka #328

Kognitivní zkreslení: Heuristika dostupnosti a komár zabiják | Mňamka #328

Naše Renča je zpět s další skvělou Psychomňamkou! Držte si klobouky, dnes se budeme bavit o heuristice se žraloky, komáry a emočním zabarvením. Řeč je o heuristice dostupnosti. Chcete vědět co to je, jak to funguje a na co si u toho dávat pozor? Neváhejte a čtěte!

Informační bezpečnost | 2. díl | Mňamka #325

Informační bezpečnost | 2. díl | Mňamka #325

Máme pro vás pokračování seriálu bezpečnostních mňamek od našeho Štěpána. Tentokrát se s námi podělí o to jak se může nic nečekající uživatel dostat do problémů s malwary jako jsou viry trojští koně atd. Při čtení článku jsme si radši rovnou udělali jeden full scan systému. Chcete vědět na co neklikat?