Základní datové typy | Mňamka #41
Datový typ je jednoduše atributem dat, který říká kompilátoru nebo interpretovi, jak programátor hodlá data použít. Většina programovacích jazyků podporuje běžné datové typy reálných , celých a booleovských . Datový typ omezuje hodnoty, které může mít výraz , například proměnná nebo funkce. Tento datový typ definuje operace, které lze s daty provádět, význam dat a způsob, jakým lze uložit hodnoty tohoto typu. Typ hodnoty, ze které může výraz vzít svou hodnotu. (zdroj wiki)
Uf. Toť definice. Co to ale ve skutečnosti znamená? Vědět, o jaký datový typ se jedná je úplný základ datové analytiky. Správná klasifikace nám ulehčí spoustu budoucích troubles. Když jsem začínala s datovou analytikou, o datových typech jsem samozřejmě slyšela, ale moc mi to hned nedocvaklo :-) Postřehla jsem to až ve chvíli, kdy jsem se učila s vizualizačním nástrojem - pokud totiž neoznačíte správně datový typ hned na startu, bude vám i to nejlepší zobrazovátko ukazovat nesmysly. Například máte-li sloupec “rok” označený jako “text - string” - pokud nezměníte datový typ na “datum - date”, nikdy nebudete schopni zobrazit data (rok) v časové ose, protože zobrazovátko nepochopí, že jde o datum.

Správná klasifikace datových typů ale není samozřejmě jen o vizualizaci. Tím úplně nejzákladnějším důvodem je velikost data. Pro každý datový typ je vyhrazeno větší či menší množství paměti - v praxi to znamená, že z hlediska místa je výhodnější mít uloženu informaci jako boolean (muž - 1 ano / 0 ne) než jako text “muž - ano”. Jakou mají jednotlivé datové typy velikost se dočtete například zde.
Nerada bych tu popisovala celou problematiku datových typů, na to jsem malý pán. Datové typy mají různou klasifikaci a pro různé programovací jazyky se mohou lišit. Jak už mám ale ve zvyku, tady je pár zajimavých odkazů, které se datovými typy zabývají trochu podrobněji:
- Analýza a vizualizace dat v jazyce R - jasné shrnutí datových typů v R
- Datové typy v SQL
- Základní datové typy v Python
Eva
Jak na web scraping prakticky? | Mňamka #514
Převod informací z webových stránek, které používají HTML a JavaScript, do čitelného formátu v podobě řádků a sloupců (tabulek) pro účely analýzy, se provádí procesem nazývaným web scraping, což je zkrácenina pro sbírání dat z webových stránek. Jednoduše řečeno, jde o kopírování obsahu webových stránek na jiné místo. Cílem tohoto článku je poskytnout praktický průvodce tím, jak to udělat.
Představení Microsoft Fabric | Mňamka #515
Dovolte nám představit Microsoft Fabric - komplexní analytickou platformu, která spojuje všechna data a analytické nástroje, které organizace potřebují. Fabric integruje technologie jako Azure Data Factory, Azure Synapse Analytics a Power BI do jednoho jednotného produktu, umožňující jak datovým, tak obchodním profesionálům odemknout potenciál svých dat a položit základy pro éru umělé inteligence.
Jak vytvořit nejlepší čárové grafy? | Mňamka #513
Čárové grafy patří mezi jedny z nejoblíbenějších grafů ve světě datové vizualizace. Umí přehledně sdělit data bez nutnosti dlouhých vysvětlení. Nicméně, aby byla jejich síla efektivně využita, je třeba dodržovat klíčové principy a osvědčené postupy. Jaká pravidla zde platí?