Design pattern #6: Události v datech | Mňamka #237

Máme tu další várku design patternů! Pojďme si ukázat, jak můžeme pracovat s událostmi v datech - zajímá vás, co předcházelo zákaznické registraci? Průměrný počet dní mezi objednávkami? Nebo jak se mění zdroj návštěv u jednotlivých klientů? Není to nic složitého!

1. Absolutní pořadí v rámci “partition” (např. klienta)

Typickým use casem pro tohle řešení je například analytika akvizičního “funnelu”, kdy sledujete jakým způsobem (a odkud) uživatel přicházel na Váš produktový web předtím, než se zaregistroval nebo udělal nákup. Může Vám to velmi pomoci v pochopení patternů chování jednotlivých zákazníků, nebo skupin, nebo třeba odhalit mezery v akvizičním procesu 

Podobně jako v případě “prvního výskytu” události, First = yes / no, můžeme očíslovat pořadí výskytu událostí v rámci jedné partition (např. 1., 2., 3. objednávka, návštěva webu apod. konkrétního zákazníka). 

Níže se můžete podívat na příklad konkrétního SQL (Snowflake), kterým se tohle řeší. Napadá Vás k čemu dalšímu by se tenhle vzor dal použít?

2. Days_since_previous jako fakt i sgroupovaný atribut

Dny od předchozí události, typicky objednávky, ukládáme jako fakt (počet dní) i jako zgroupovaný atribut (tj. uplynulo od poslední objednávky třeba měně než 7 dní, 14 dní, 30 dní, 90+ dní…). Případně mohou být kategoie disjunktní (0-7 dní, 8-14 dní...), záleží na konkrétním use-case.

Proč? Z počtu dní od poslední objednávky můžeme sledovat metriky jako průměrný počet dní mezi objednávkami. Přes sgupované atributy může uživatel snadno slicovat a sledovat chování zákazníků v jednotlivých kategoriích (např. nejvíce zákazníků udělá další objednávku jednou do měsíce, pokud se konkrétní zákazník posune do kategorie ‘90+ dní’, pravděpodobně ho firma ztratí...) Jedná se o typický use case, na který se hodí mít data připravená tak, aby si uživatel mohl snadno vytvářet reporty a metriky. Nehodí se jen pro e-shopy, ale třeba i pokud sledujeme návštěvnost libovolného webu a další use-cases.

Previous atributy

Previous atributy se typicky hodí pro vyhodnocení marketingových kampaní (např. zda se podařilo dostat návštěvníky z cpc do directu, nebo naopak, pokud přišli návštěvníci na web minule přímo a nyní přes placenou kampaň, je kampaň špatně zacílená...). V kombinaci s days_since_previous lze namodelovat celý acquisition funnel. V SQL spočítáme obdobně, pomocí window funkce LAG. Opět se jedná o typický use case.

Máte nějaký další tip, který děláte “vždycky a všude”? 

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Petra Horáčková
datový detektiv
LinkedIn

Banana data podcast | Mňamka #242

Banana data podcast | Mňamka #242

Chcete být v obraze a vědět, co se aktuálně děje ve světě dat? Slyšeli jste o Banana Data Podcastu? Pokud vás baví technologické trendy a témata jako zjednodušování AI, etická dilemata AI, otazníky proč a jak v datové vědě a mnoho dalších, můžeme vřele doporučit! Banana data podcasty už nějaký ten rok jedou a je z čeho vybírat!

APIFY: 10 nejlepších nástrojů pro web scraping | Mňamka #241

APIFY: 10 nejlepších nástrojů pro web scraping | Mňamka #241

Chcete být v obraze a vědět, co se aktuálně děje ve světě dat? Slyšeli jste o Banana Data Podcastu? Pokud vás baví technologické trendy a témata jako zjednodušování AI, etická dilemata AI, otazníky proč a jak v datové vědě a mnoho dalších, můžeme vřele doporučit! Banana data podcasty už nějaký ten rok jedou a je z čeho vybírat!

Ze života datového detektiva I. - Průvodce světem dat

Ze života datového detektiva I. - Průvodce světem dat

Hodně často kolem sebe slýcháme otázku: a co že vy teda děláte? První díl z celkem čtyř o tom, jak datový detektiv funguje v každodenním životě. Naše práce je opravdu hodně komplexní a musíme zdatně propojovat analytické a businessové skills. Začneme tím, jak probíhá náš první kontakt se zákazníkem! Datový detektiv je totiž také obchoďák a accounťák. Eva a Rado vám umožní nahlédnout do svých běžných pracovních dnů. Co dělají? Jak probíhají první jednání s budoucími zákazníky a co je na tom baví?