Základy vizualizace dat | Mňamka #231

Díváte se do tabulky plné čísel a jednotlivé sloupce vám vzájemně splývají. Než se dostanete na konec řádku, ztrácíte přehled o jeho začátku a opačně. Co ta čísla vlastně znamenají a jak se v nich vyznat? 

Jako řešení se jeví vizualizace dat do přehledných grafů, ale jak to udělat? Shrnuli jsme pro vás pár základních kroků, jak na to.

1. Pochopení kontextu

Nejprve je třeba se rozhodnout, co chceme prezentovat. V případě, že se rozhodneme vybrat graf a až poté data, pak to nemusí dopadnout dle našich představ. Můžeme být v konečném výsledku zmatení. Graf by možná vypadal pěkně, ale mohl by být zcela nevhodný k daným potřebám.

Než si tedy začneme vytvářet graf, musíme se podívat na data a zamyslet se nad tím, jak v konečném výsledku mají vypadat. Zároveň ale myslet i na to, zda bude graf představovat, to co má a zda bude čitelný. Vždy přizpůsobujeme graf našim datům, nikoliv data grafům.

2. Který graf použít

Jaké grafy tedy k našim datům máme použít? Každý graf se hodí na znázornění trochu jiných dat. Na výběr máme širokou škálu grafů, které můžeme použít. Na pár z nich se podíváme.

Začneme spojnicovým grafem, který je jedním z nejpoužívanějších. Slouží pro znázornění změn hodnot v čase. Spojnicový graf ukazuje celkový trend s malou šancí na nesprávnou interpretaci.

Dalším často využívaným grafem je sloupcový graf, který poskytuje rychlý přehled o poměrech jednotlivých hodnot. Pro kvantitativní údaje, jako jsou prognózy poptávek nebo třeba prodané produkty, je tedy vhodné použít právě sloupcový graf.

V neposlední řadě se podíváme na bodový graf, který nám ukazuje vztah mezi dvěma kategoriemi. Bodový graf nám ukazuje, zda mezi daty existují korelace či ne. 

3. Smažte zbytečnosti a zvýrazněte podstatné 

Grafy je třeba udržovat přehledné, abychom se v nich vyznali.

Zeptejme se sami sebe: „Když tohle odstraním, změní se něco?” Pokud je odpověď „Ne”, nastal čas trochu graf promazat. Zmizet může mřížka nebo ohraničení grafu, osy můžeme vyčistit od defaultních názvů a přidat výstižnější. Podrobnosti a potřebný obsah můžete vložit do přílohy. 

Nesmíme zapomínat zvýrazňovat v grafech to, co je důležité. Můžeme k tomu použít velikost písma, tučný, podtržený nebo kurzívou psaný text. Opravdu důležité části mohou být psány velkým písmem.

Důležitý obsah vkládáme do záhlaví, neboť to je první věc, které si všimneme.

4. Design 

Jak je všeobecně známo, jíme očima, to samé platí pro vizualizace. Barvy a styly nám pomohou porozumět datům. Co třeba zvolit stejnou paletu barev, jakou používáte ve svém firemním logu? Nebo ztráty odlišit od zisku použitím červené a zelené barvy? Tohle vše nám pomůže se v grafech zorientovat. 

Obecně bychom se měli držet symboliky barev. Teplotu zobrazovat na paletce
od modré po červenou a pro množství v regionech zvolit jednu centrální barvu, které podle četnosti výskytu upravujeme sytost. Bílé pozadí je základ. Vždy bychom měli myslet na přehlednost a nenechat se unést přílišnou kreativitou. Udržujme stejné barvy grafu a jeho popisků, ať víme, co k čemu patří.

5. Storytelling

Pro větší srozumitelnost můžeme při vysvětlování dat vyprávět tématický příběh, který má přesah do emoční oblasti, kam se fakta nedostanou. Příběh by měl být srozumitelný, poutavý a mít pointu, která souvisí s naší problematikou.

6. Příprava na prezentaci

A je tu velké finále! Z naší původní tabulky plné čísel máme už vytvořené krásné grafy, ale ještě pořád nemáme vyhráno. Na prezentaci svého výsledku bychom si měli dát záležet. Stejně jako na začátku naší cesty, je potřeba pochopit kontext
a zaměřit se především na potřeby publika naší prezentace. 

První slidy zaměříme na hlavní myšlenku - problém, který jsme zanalyzovali. Přidáme data, která ho demonstrují a uvedeme i upozornění na možné následky, které by nastaly, pokud by zůstal neřešený. Následovat by mělo i možné řešení
a ilustrace jeho přínosů. Na konci nezapomeneme na shrnutí problematiky.

7. Feedback

Dobrá rada nad zlato. Vždy se vyplatí ptát se na názor kolegů nebo přátel i v průběhu tvorby vizualizace. Zajímat se o to, na co se soustředí oni a co jim přijde přehledné a srozumitelné. Finální feedback nám pomůže poznat názor našeho publika a ideálně se z něj poučit pro příště. 

Co závěrem? Doufáme, že pro Vás byl tento článek zajímavý a dozvěděli jste se třeba i něco nového. Držíme Vám palce při vizualizaci Vašich dat!

Zdroje:
[1] Cole Nussbaumer Knaflic, “Storytelling with Data: A Data Visualization Guide for Business Professionals” (2015), Wiley, 1st edition
[2] SADEK, Daffa. Making People Understand Your Data: A Data Visualization Tutorial. 2021, , 1. Dostupné také z: https://daffasadek.medium.com/making-people-understand-your-data-a-data-visualization-tutorial-9a4abe13a7a6 
[3] OPHELIAMING. 10 Tips for Storytelling With Data Visualization to Win Your Audience. 2021, , 1. Dostupné také z: https://medium.com/geekculture/10-tips-for-storytelling-with-data-visualization-to-win-your-audience-19753579905a

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rádi to s Vámi probereme :-)

Petra Nedvědová
datový detektiv
LinkedIn

Jan Pajer
datový detektiv
LinkedIn

Základní pojmy v datovém modelování | Mňamka #457

Základní pojmy v datovém modelování | Mňamka #457

Co je to datový model? Jaký je rozdíl mezi konceptuálním a logickým modelem? A k čemu slouží proces tzv. normalizace? Bez datového modelování se dnes v BI obejdete už jen stěží, Kuba si o něm proto připravil krátkou minisérii, ve které si vše probereme od úplných základů. V prvním díle se seznámíme s nejdůležitějšími pojmy, které byste v této souvislosti měli znát, a na jednoduchém příkladu z oblasti sales si ukážeme, jak takový datový model vlastně vypadá. Tak pojďme na to!

MAQL II. - MAQL Reuse factů & Nesting metrik | Mňamka #454

MAQL II. - MAQL Reuse factů & Nesting metrik | Mňamka #454

Proč se vyplatí recyklovat metriky v MAQL? Máme tady pokračování naší krátké minisérie o dotazovacím jazyku MAQL od Péti. V minulém díle jsme si osvětlili základní rozdíl mezi SQL a MAQL a dnes se zaměříme na výhody metrik vytvořených pomocí MAQL a jejich recyklaci. Funguje to přitom podobně jako v případě klasické recyklace surovin. Pokud ji dělat nebudete, ušetříte si možná půl minutky práce, v budoucnu se vám to ale může velmi nepříjemně vrátit. Tak se na to pojďte podívat!

Šaty dělají kód aneb Proč je někdy lepší kebab než velbloud | Mňamka #441

Šaty dělají kód aneb Proč je někdy lepší kebab než velbloud | Mňamka #441

I špatný standard může být lepší než žádný standard. Bez toho totiž ve vašem kódu velmi snadno zavládne chaos. V praxi se např. často stává, že lidé halabala kombinují různé druhy uvozovek, míchají malá a velká písmena v pojmenování proměnných nebo se pro jistotu vůbec žádných jmenných konvencí nedrží. Ostatně, Tomáš už se o tom mnohokrát přesvědčil na vlastní pěst. Sepsal pro vás proto mňamku, ve které si připomeneme, proč byste přece jen nějaký standard při psaní kódu mít měli!