Design pattern #6: Události v datech | Mňamka #237

Máme tu další várku design patternů! Pojďme si ukázat, jak můžeme pracovat s událostmi v datech - zajímá vás, co předcházelo zákaznické registraci? Průměrný počet dní mezi objednávkami? Nebo jak se mění zdroj návštěv u jednotlivých klientů? Není to nic složitého!

1. Absolutní pořadí v rámci “partition” (např. klienta)

Typickým use casem pro tohle řešení je například analytika akvizičního “funnelu”, kdy sledujete jakým způsobem (a odkud) uživatel přicházel na Váš produktový web předtím, než se zaregistroval nebo udělal nákup. Může Vám to velmi pomoci v pochopení patternů chování jednotlivých zákazníků, nebo skupin, nebo třeba odhalit mezery v akvizičním procesu 

Podobně jako v případě “prvního výskytu” události, First = yes / no, můžeme očíslovat pořadí výskytu událostí v rámci jedné partition (např. 1., 2., 3. objednávka, návštěva webu apod. konkrétního zákazníka). 

Níže se můžete podívat na příklad konkrétního SQL (Snowflake), kterým se tohle řeší. Napadá Vás k čemu dalšímu by se tenhle vzor dal použít?

2. Days_since_previous jako fakt i sgroupovaný atribut

Dny od předchozí události, typicky objednávky, ukládáme jako fakt (počet dní) i jako zgroupovaný atribut (tj. uplynulo od poslední objednávky třeba měně než 7 dní, 14 dní, 30 dní, 90+ dní…). Případně mohou být kategoie disjunktní (0-7 dní, 8-14 dní...), záleží na konkrétním use-case.

Proč? Z počtu dní od poslední objednávky můžeme sledovat metriky jako průměrný počet dní mezi objednávkami. Přes sgupované atributy může uživatel snadno slicovat a sledovat chování zákazníků v jednotlivých kategoriích (např. nejvíce zákazníků udělá další objednávku jednou do měsíce, pokud se konkrétní zákazník posune do kategorie ‘90+ dní’, pravděpodobně ho firma ztratí...) Jedná se o typický use case, na který se hodí mít data připravená tak, aby si uživatel mohl snadno vytvářet reporty a metriky. Nehodí se jen pro e-shopy, ale třeba i pokud sledujeme návštěvnost libovolného webu a další use-cases.

Previous atributy

Previous atributy se typicky hodí pro vyhodnocení marketingových kampaní (např. zda se podařilo dostat návštěvníky z cpc do directu, nebo naopak, pokud přišli návštěvníci na web minule přímo a nyní přes placenou kampaň, je kampaň špatně zacílená...). V kombinaci s days_since_previous lze namodelovat celý acquisition funnel. V SQL spočítáme obdobně, pomocí window funkce LAG. Opět se jedná o typický use case.

Máte nějaký další tip, který děláte “vždycky a všude”? 

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Petra Horáčková
datový detektiv
LinkedIn

Cirkulární graf co rozbil twitter | Mňamka #279

Cirkulární graf co rozbil twitter | Mňamka #279

V této mňamce se podíváme na trochu vizualizačního masakru, co udělal velký rozruch na Twitteru. Jde o graf, který vytvořili v New York Times a někteří ho už sedmí den roku 2022 nazvali nejhorší vizualizací tohoto roku. Jakožto každá trochu kontroverzní věc má i tento graf svoje obhájce. Co myslíte? Je to super způsob, jak ukázat timeline dat anebo to vypadá otřesně a někomu by měli sebrat licenci k vizuálním nástrojům?

Co je to Data Security? | Mňamka #278

Co je to Data Security? | Mňamka #278

V tomto článku se podíváme na základy toho, co je Data security neboli datová bezpečnost. V bizztreatu nám na security záleží, a myslíme si, že toto bude jedno z „hot“ témat roku 2022. Pojďme is tedy připomenout co se pod tímto výrazem skrývá. Pod odkazem se skrývá článek z dataversity, který vás navede na velké množství zdrojů o datové bezpečnosti například od MIT. Tak se pojďte podívat co je v bezpečnosti nového a proč je to tak důležité.

Ze života datového detektiva 4: Designér, architekt a konzultant #277

Ze života datového detektiva 4: Designér, architekt a konzultant #277

Je to tady, další článek ze seriálu „Ze života datového detektiva“, tentokrát se budeme bavit o tom co dělá architekt, designér a konzultant v Bizztreatu. Naše Verča vám to pěkně sepsala a je to fakt zajímavý čtení s hromadou prokliků na další zajímavý kontent od nás. Zajímá vás, jak to v bizztreatu s architekturou děláme? Jaký je postup pro architekta samotného? Nebo jak na architekturu navazuje datová kvalita a data governance? Pokud jste na jednu z těchto otázek odpověděli „ano“ tak šup na link a pusťte se do toho.