Základní datové typy | Mňamka #41

Datový typ je jednoduše atributem dat, který říká kompilátoru nebo interpretovi, jak programátor hodlá data použít. Většina programovacích jazyků podporuje běžné datové typy reálných , celých a booleovských . Datový typ omezuje hodnoty, které může mít výraz , například proměnná nebo funkce. Tento datový typ definuje operace, které lze s daty provádět, význam dat a způsob, jakým lze uložit hodnoty tohoto typu. Typ hodnoty, ze které může výraz vzít svou hodnotu. (zdroj wiki) 

Uf. Toť definice. Co to ale ve skutečnosti znamená? Vědět, o jaký datový typ se jedná je úplný základ datové analytiky. Správná klasifikace nám ulehčí spoustu budoucích troubles. Když jsem začínala s datovou analytikou, o datových typech jsem samozřejmě slyšela, ale moc mi to hned nedocvaklo :-) Postřehla jsem to až ve chvíli, kdy jsem se učila s vizualizačním nástrojem - pokud totiž neoznačíte správně datový typ hned na startu, bude vám i to nejlepší zobrazovátko ukazovat nesmysly. Například máte-li sloupec “rok” označený jako “text - string” - pokud nezměníte datový typ na “datum - date”, nikdy nebudete schopni zobrazit data (rok) v časové ose, protože zobrazovátko nepochopí, že jde o datum.

Správná klasifikace datových typů ale není samozřejmě jen o vizualizaci. Tím úplně nejzákladnějším důvodem je velikost data. Pro každý datový typ je vyhrazeno větší či menší množství paměti - v praxi to znamená, že z hlediska místa je výhodnější mít uloženu informaci jako boolean (muž - 1 ano / 0 ne) než jako text “muž - ano”. Jakou mají jednotlivé datové typy velikost se dočtete například zde

Nerada bych tu popisovala celou problematiku datových typů, na to jsem malý pán. Datové typy mají různou klasifikaci a pro různé programovací jazyky se mohou lišit. Jak už mám ale ve zvyku, tady je pár zajimavých odkazů, které se datovými typy zabývají trochu podrobněji: 

Eva

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Eva Hankusová
detektiv nových příležitostí
LinkedIn

4 alternativy k nadužívaným grafům | Mňamka #415

4 alternativy k nadužívaným grafům | Mňamka #415

Sloupcový, bodový a spojnicový graf. Pokud už jste někdy vizualizovali data, je vysoce pravděpodobné, že jste tyto velmi populární grafy použili. A není se vlastně ani čemu divit, jde totiž o poměrně jednoduché grafy, se kterými každý z nás začínal. Má to ale i svou stinnou stránku. Často totiž máme tendenci používat tyto grafy i pro use casy, pro které se tak úplně nehodí. Dobrou zprávou ale je, že existuje celá řada zajímavých alternativ. Slyšeli jste např. o vodopádových grafech? Pokud ne, tak se mrkněte na dnešní mňamku!

Jak na datovou extrakci | Mňamka #414

Jak na datovou extrakci | Mňamka #414

Většina z nás má v dnešní době přístup k většímu množství dat než kdykoliv předtím. I firmy už se poměrně běžně snaží čerpat data z co nejširšího spektra datových zdrojů nejrůznějšího charakteru. Pokud ale takto získaná data chcete dobře využít a odvodit z nich cenné poznatky, potřebujete je nejprve dostat na jedno místo a optimalizovat pro další analýzu. Prvním a nejkritičtějším krokem v tomto procesu je tzv. extrakce dat. Dnes si proto ukážeme, jaké typy extrakce dat existují a jak tento proces vlastně funguje!

Jak (ne)vytvářet datovou strategii | Mňamka #413

Jak (ne)vytvářet datovou strategii | Mňamka #413

V některých firmách dají nejprve pracně dohromady datovou strategii, pak si ji založí do šuplíku a vyhlížejí dalšího experta, který toto téma znovu vytáhne. V jiných společnostech se zase až příliš zaměřují na data a byznysová stránka věci je odsunuta na druhou kolej. Výsledkem pak často bývá strategie, která slouží spíše potřebám analytiky než celého byznysu. Pokud se chcete těmto a dalším problémům vyvarovat, máme tu mňamku přímo pro vás. Bez kvalitní datové strategie se totiž v dnešní době už jen stěží obejdete!