Základní datové typy | Mňamka #41
Datový typ je jednoduše atributem dat, který říká kompilátoru nebo interpretovi, jak programátor hodlá data použít. Většina programovacích jazyků podporuje běžné datové typy reálných , celých a booleovských . Datový typ omezuje hodnoty, které může mít výraz , například proměnná nebo funkce. Tento datový typ definuje operace, které lze s daty provádět, význam dat a způsob, jakým lze uložit hodnoty tohoto typu. Typ hodnoty, ze které může výraz vzít svou hodnotu. (zdroj wiki)
Uf. Toť definice. Co to ale ve skutečnosti znamená? Vědět, o jaký datový typ se jedná je úplný základ datové analytiky. Správná klasifikace nám ulehčí spoustu budoucích troubles. Když jsem začínala s datovou analytikou, o datových typech jsem samozřejmě slyšela, ale moc mi to hned nedocvaklo :-) Postřehla jsem to až ve chvíli, kdy jsem se učila s vizualizačním nástrojem - pokud totiž neoznačíte správně datový typ hned na startu, bude vám i to nejlepší zobrazovátko ukazovat nesmysly. Například máte-li sloupec “rok” označený jako “text - string” - pokud nezměníte datový typ na “datum - date”, nikdy nebudete schopni zobrazit data (rok) v časové ose, protože zobrazovátko nepochopí, že jde o datum.

Správná klasifikace datových typů ale není samozřejmě jen o vizualizaci. Tím úplně nejzákladnějším důvodem je velikost data. Pro každý datový typ je vyhrazeno větší či menší množství paměti - v praxi to znamená, že z hlediska místa je výhodnější mít uloženu informaci jako boolean (muž - 1 ano / 0 ne) než jako text “muž - ano”. Jakou mají jednotlivé datové typy velikost se dočtete například zde.
Nerada bych tu popisovala celou problematiku datových typů, na to jsem malý pán. Datové typy mají různou klasifikaci a pro různé programovací jazyky se mohou lišit. Jak už mám ale ve zvyku, tady je pár zajimavých odkazů, které se datovými typy zabývají trochu podrobněji:
- Analýza a vizualizace dat v jazyce R - jasné shrnutí datových typů v R
- Datové typy v SQL
- Základní datové typy v Python
Eva
Excel or Not to Excel?
Excel can be a great tool for quick analyses, but it’s long been unsuitable for managing medium and large businesses. If you’ve ever tried opening a massive file with thousands of records, you know exactly what we mean. But it’s not just about wasted time—“Excel-ing” in a large company can cost you a fortune. How much? Find out in today’s Mňamka, where Patrik breaks down the biggest pain points of handling data in Excel! 🚀