Data jsou majetek. Jaká je jejich hodnota? | Mňamka #286

Jak přemýšlet o datech jako leader.

Tento článek je překladem ze stránek Medium od autora Adama Votavy. Přepis prezentace pana Votavy na konferenci Primetime for Big Data 2021.

Autor během prezentace | Fotka Jiřího Šeda

Intuitivně všichni chápeme, že data mají nějakou hodnotu. Je to jeden z důvodů proč firmy investují obrovské prostředky do dat a proč spousta lidí zvolila data jako svou kariéru. 

Navíc data splňují definici majetku podle standardů klasifikace IFRS (a dokonce OECD).

„Majetkem je zdroj, který je kontrolovatelný entitou na základě výsledků z dob minulých, u kterého se očekává ekonomický benefit pro danou entitu v dobách budoucích.“

I když jsou data hodnotným majetkem, nenajdeme je na našich účetních bilancích. Proč ne? Doug Laney, autor Infonomics – knihy o monetizaci a valuaci informací – tuto skutečnost napojuje na 9. září

Útok na World Trade Centre roku 2001 nevedl pouze k tragickým ztrátám na životech a nemovitostech. Obrovská kvanta dat, která byla uložena na fyzických serverech ve dvojčatech byla také nenávratně ztracena. 

Tato skutečnost vyděsila pojišťovny. Představte si, jaká mohla být hodnota všech těch ztracených seznamů zákazníků, historických transakcí a objednávek! Aby si pod sebou nepodřezali větev, pojišťovny vynechali informační majetek z jejich pojistitelných objektů. Neztráceli čas a kola se dala do pohybu – vynechání informačního majetku z pojistek bylo kompletní do měsíce po útoku. Účetní systémy následovali pojišťovny v roce 2004, od té doby se data nepočítají (jelikož nemůžou být pojištěna). 

Jenomže to neznamená, že data nemají žádnou hodnotu. Jejich hodnota je spíše přirozená vlastnost; ne něco o čem by mohla rozhodovat nějaká autorita. Vyčíslení hodnoty dat je na trhu a jeho účastnících. A tak vidíme spousty nových online tržišť s daty, kde společnosti mohou prodávat a nakupovat jednotlivé data sety pro svou vlastní potřebu. Zamyslete se nad tím, existuje velké množství společností, jejímž jediným produktem je vytváření různých typů dat pro ostatní. 

Data se také dají použít jako zajištění, tak jak je použili United Airlines a American Airlines během pandemie Covid-19. Data z jejich věrnostních programů byla naceněna kolem 20 bilionů dolarů za aerolinku. 

Není zajímavé, jak něco co nemá žádnou hodnotu pro pojišťovny, má obrovskou hodnotu (a dá se tím ručit) pro banky? Ale jak přišli na ta čísla? Jak bychom měli data zhodnocovat?

Říká se, že krása závisí na úhlu pohledu, to samé bychom mohli říct o hodnotě dat pro kupující a prodávající. Pohled prodávajícího se často zaobírá náklady na budování data setu a na případné evaluaci dopadů na byznys kupujícího. Pohled kupujících na druhou stranu evaluuje náklady na budování (rozhodnutí mezi budováním nebo koupením data setu) a případným dopadem na byznys – který obvykle dokážou určit přesně. Výsledkem je jaksi symetrická informační asymetrie mezi kupci a prodejci. 

Jak to funguje v praxi? Viděl jsem případy kdy cena z pohledu prodávajícího byla 10 krát vyšší než jaká měla být podle kupce. Taková mezera je moc velká na to, aby se dala uzavřít při vyjednávání o ceně.  I když jsem si jistý, že ostatní potencionální kupci by byly více než spokojeni s touto stanovenou cenou. 

Protože, jak jsem řekl, krása závisí na úhlu pohledu. 

Všimněte si ale, že oba jak kupci, tak prodávající, zvažují benefity pro byznys. Jelikož ekonomická hodnota dat je v této transakci klíčová. 

Všichni jsme viděli příklady kdy data byla použita pro lepší rozhodování, pro zlepšení efektivity operací nebo dokonce pro vytvoření zbrusu nových kanálů pro generaci příjmů. Všechny tyto příklady mají dopad na bilanci podniků a tak mají nějakou hodnotu. 

V momentu kdy přemýšlíme nad ekonomickou hodnotou, doporučuji si nechat poradit od Billa Schmarzo, ten dělá výbornou práci v pochopení ekonomie dat. Říká že:“ Nemůžete vyčíslit hodnotu dat v izolaci od byznysu.“

Data mají mnoho unikátních vlastností – nemohou dojít, zkazit se, mohou být použita znovu a znovu. Díky tomu, říká Bill,  čím víc data používáme tím víc se zplošťují mezní náklady (efekt #1) a ekonomická hodnota roste (efekt #2).

Navíc lze data využít více způsoby paralelně! Představte si zákaznický data set využívaný pro určení ceny, doporučení produktů a také na marketingové kampaně individuálním zákazníkům. Když zlepšíme kvalitu takového zákaznického data setu nebo k němu přidáme novou relevantní atributu, má to dopad na všechna datová řešení, které jsou na něm závislá. Díky tomu se ekonomická hodnota zvedá (efekt #3).

Schmarzova Ekonomická evaluační teorie digitálních majetků | Zdroj: Bill Schmarzo, Big Data MBA | Obrázek autora

Takže, co jsou data use cases na ose X?

Pro mě jsou datový use case, datový projekt, datová iniciativa anebo dokonce celá datová strategie o třech otázkách:

Obrázek Autora

První otázka pojí náš datový projekt k byznysu. A hlavně nám zprostředkuje měření ekonomické hodnoty (například Operační náklady, roční opakující se příjmy, …).

Druhá otázka musí být zodpovězena holisticky, jelikož málokdy potřebujeme pouze data a jejich analýzu. Musíme vzít v potaz strategické nastavení, infrastrukturu, a asi nejdůležitější aspekt - lidi. Odpověď na tuto otázku nám také dá představu o tom, jak tato investice vypadá.

A nakonec třetí otázka, která vytváří plán úkonů. Dovoluje nám rozplánovat ekonomické benefity a investice do sekvencí. 

Slyším vás se ptát, jak taková investice do dat vypadá? Je to podobné jakékoli jiné investici – návratnost na investici do dat odpovídá již známé investiční J-křivce. 

Máme tu pro vás 2 důležité body:

  1. Čas se nezastaví. Takže pokud chceme maximalizovat ekonomickou hodnotu dat v jednom roce, neměli bychom plýtvat časem a půl roku vymýšlet co dělat. 
  2. Tvar J-křivky je pouze ilustrativní. Nikdo vám nemůže zaručit, že pád v křivce nebude hlubší, nebo že se vůbec křivka obrátí a bude putovat zpět k povrchu, nebo že se vyrovná dost rychle, či že bude růst exponenciálně tak rychle jak se očekává (nebo tak dlouho)

Investiční J-křivka není nic nového, nicméně investice do dat nejsou často řízeny tak pečlivě jako ostatní. 

V mé profesionální kariéře jsem pracoval pro korporáty, v poradenství, ve start-upech a v soukromých investorských skupinách. Z těchto vlastních zkušeností vám mohu sdělit tyto pohledy:

  • V korporátech často přemýšlíme nad přibližným budoucím dopadem abychom si obhájili rozpočet. Opravdový dopad se málokdy měří. 
  • Poradci „prodávají“ návrat na investice pro individuální projekty, takže klient skončí s tucty J-křivek (pro Churn model, datový sklad, nové ERP, implementaci Tableau, …), které jsou těžce sčitatelné a je problém s nimi nepočítat tak, aby se navzájem nekryly nebo na nějakou investici nezapomenout. 
  • Investice do dat ve start-upech je obvykle dělaná hlavně kvůli valuaci při dalším kole investic. Kvůli tomu se realizace benefitů často posouvá na později. 
  • V privátních investorských fondech se data zdají být řízena opravdu pečlivě. Investor koupí byznys na základě valuace, která se opírá o klíčové metriky s tím, že byznys za 5-7 let prodá se ziskem. Klíčovým v investici do dat se v tomto bodě stává investice do dat, co ovlivní tyto metriky. Do těchto dat se investuje hodně v rámci prvních pár let. Investor musí vidět tuto společnost v rámci J-křivky a prodat ji v momentě kdy je stále na trajektorii růstu (a klidně nechá trochu této hodnoty pro dalšího majitele) aby podtrhl výslednou valuaci. 

Takže, jak to funguje v opravdovém životě?

Pojďme si jako příklad uvést SaaS B2B technologickou společnost. Byznys problém (pamatujte, první otázka definující datový projekt), který má většina těchto společností je růst ročních opakujících se příjmů (ARR) potencionálně přes cross sell a up sell.   

Dále musíme vzít v potaz to, co je potřeba k tomu, abychom problém vyřešili (druhá otázka pro datové projekty). V DataDiligence používáme SAPI framework abychom si připomněli všechny důležité faktory ovlivňující úspěšnost datových projektů. Podívejme se na rychlý příklad na vysoké úrovni. 

  • Z pohledu strategie, budeme potřebovat silného sponzora a úzkou kolaboraci mezi daty, obchodním oddělením a marketingem. 
  • U dat a jejich analýz zase kvalitní CRM data a modely sklonu k nákupu.
  • Potřebujeme datové profesionály, kteří vytvoří x-sell modely. Také potřebujeme, aby obchodní oddělení a marketingové týmy dělali rozhodnutí na základě dat a pomáhali překlopit čísla ze sklonů na objednávky. Nezapomeňme, že jsou to právě lidé, kdo musí etablovat datovou kulturu a její adopci.  
  • Nakonec samozřejmě potřebujeme datovou infrastrukturu, na které to celé poběží. S ní také platformu pro datovou vědu, ve které se dají budovat modely. 

A ještě třetí otázka, která se váže na datové projekty – jak to všechno uděláme? Nebudu zacházet moc do detailů, jelikož každý projekt je něčím jiný a unikátní. Ale z pohledu ekonomické hodnoty má tato cesta čtyři fáze. 

  1. Napřed se zaměříme na základy – Příprava infrastruktury, sběr dat atd. 
  2. Dalším krokem je vytvořit datové výstupy – například modely sklonu k nákupu. 
  3. Poté se bavíme s obchodním oddělením a marketingem o x-sell (tížených byznys výsledcích).
  4. A konečně spustíme celý systém a snažíme se škálovat jeho dopad co nejvíc a na co nejdéle.

Jelikož jsou data strategickou investicí mělo by se s nimi tak i zacházet, k projektu by měl být zaveden i investiční plán. Toto obvykle obsahuje i všechny investice potřebné (CAPEX, OPEX, infrastrukturu, lidi, …), dopad na klíčové byznys metriky (roční opakující se příjmy ARR), a dopad na cash flow a EBITDU (například), měřené kvartálně nebo v jakémkoli rozumném časovém horizontu. 

Jedna otázka na kterou se mě lidé vždycky ptají je, jak řadím dopad na byznysovou metriku k datovému projektu, když je ve hře tolik ostatních faktorů – ostatní projekty, konkurence, marketingové kampaně, obecná situace na trhu atd. Odpovědí je používání dat k rozhodování! V našem příkladu bychom mohli použít A/B testování, možná i využitím placebo skupiny. Evaluovat a pokusit se navrhnout opravdový dopad datového projektu co nejpřesněji. 

Představme si, že tento projekt půjde dobře a dopad na ARR překoná očekávání. Co teď?

Abychom si mohli odpovědět musíme se vrátit k ekonomickým datům.

Schmarzova Ekonomická evaluační teorie digitálních majetků | Zdroj: Bill Schmarzo, Big Data MBA | Obrázek autora

A budeme pokračovat podle těchto kroků abychom maximalizovali naši šanci na úspěch:

  1. Zavedeme datovou strategii pro správné tvoření sekvencí v projektu. 
  2. Začneme! (Čas na nikoho nečeká).
  3. Děláme jeden projekt za druhým, budujeme na vítězstvích (a poučení) z dat jako takových.

Toto je jediný způsob, jak systematicky realizovat ekonomickou hodnotu z dat. 

A to je jádrem pudla.

Data jsou aktiva. Řešte je tak!

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rádi to s vámi probereme :-)

Adam Votava
Data Scientist
Linkedin

Jak přistupovat k user managementu v datové analytice? | Mňamka #373

Jak přistupovat k user managementu v datové analytice? | Mňamka #373

Ne každý ve firmě by měl mít přístup úplně ke všem datům. A to ani tam, kde naplno vládne datová demokratizace. Základem dobré bezpečnosti je totiž tzv. princip nejnižších privilegií – nedávejte uživatelům přístup tam, kam ho nepotřebují. Stejně tak je ale potřeba pro klíčové procesy nastavit odpovídající kontrolní mechanismy, které povedou k minimalizaci bezpečnostních rizik. Co dalšího ještě můžete udělat? Verča pro vás popsala 5 důležitých bodů, kterých se společně s našimi klienty při přidělování uživatelských přístupů a práv snažíme držet.

Je to mezera, není to mezera? | Mňamka #370

Je to mezera, není to mezera? | Mňamka #370

O významu čištění dat toho bylo napsáno již poměrně hodně. Zjednodušeně by se to dalo shrnout takto – pokud si neuděláte úklid už na vstupu, budete mít neskutečný bordel i na výstupu. Dnes se proto podíváme, jak ve si Snowflake SQL vyčistit finanční čísla z Google Sheets. Petr vám postupně ukáže, jak by měl vypadat čistící skript pro data různých formátů. A narazil při tom i na jeden opravdu záludný oříšek. Není totiž mezera jako mezera. O tom už ale více v dnešní mňamce!

Period Over Period v Tableau | Mňamka #367

Period Over Period v Tableau | Mňamka #367

Při práci s daty ve vizualizačních nástrojích si velmi často potřebujete porovnat jednotlivá časová období. Zajímají vás např. prodeje tento vs. předchozí rok. V Tableau máte hned několik možností, jak takové period over period srovnání provést. Kterou z nich ale zvolit? Tomáš pro vás sepsal mňamku, ve které vás postupně provede výhodami a nevýhodami standardního řešení v podobě Quick Table Calculation, použití LOOKUP funkce, výpočetně náročnějšího data blendingu a variabilního custom filteru s předdefinovaným obdobím.