Základní datové typy | Mňamka #41

Datový typ je jednoduše atributem dat, který říká kompilátoru nebo interpretovi, jak programátor hodlá data použít. Většina programovacích jazyků podporuje běžné datové typy reálných , celých a booleovských . Datový typ omezuje hodnoty, které může mít výraz , například proměnná nebo funkce. Tento datový typ definuje operace, které lze s daty provádět, význam dat a způsob, jakým lze uložit hodnoty tohoto typu. Typ hodnoty, ze které může výraz vzít svou hodnotu. (zdroj wiki) 

Uf. Toť definice. Co to ale ve skutečnosti znamená? Vědět, o jaký datový typ se jedná je úplný základ datové analytiky. Správná klasifikace nám ulehčí spoustu budoucích troubles. Když jsem začínala s datovou analytikou, o datových typech jsem samozřejmě slyšela, ale moc mi to hned nedocvaklo :-) Postřehla jsem to až ve chvíli, kdy jsem se učila s vizualizačním nástrojem - pokud totiž neoznačíte správně datový typ hned na startu, bude vám i to nejlepší zobrazovátko ukazovat nesmysly. Například máte-li sloupec “rok” označený jako “text - string” - pokud nezměníte datový typ na “datum - date”, nikdy nebudete schopni zobrazit data (rok) v časové ose, protože zobrazovátko nepochopí, že jde o datum.

Správná klasifikace datových typů ale není samozřejmě jen o vizualizaci. Tím úplně nejzákladnějším důvodem je velikost data. Pro každý datový typ je vyhrazeno větší či menší množství paměti - v praxi to znamená, že z hlediska místa je výhodnější mít uloženu informaci jako boolean (muž - 1 ano / 0 ne) než jako text “muž - ano”. Jakou mají jednotlivé datové typy velikost se dočtete například zde

Nerada bych tu popisovala celou problematiku datových typů, na to jsem malý pán. Datové typy mají různou klasifikaci a pro různé programovací jazyky se mohou lišit. Jak už mám ale ve zvyku, tady je pár zajimavých odkazů, které se datovými typy zabývají trochu podrobněji: 

Eva

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Eva Hankusová
detektiv nových příležitostí
LinkedIn

Nahradí AI datové analytiky? | Mňamka #461

Nahradí AI datové analytiky? | Mňamka #461

Koho všeho nahradí umělá inteligence? To je asi jedno z nejdiskutovanějších témat letošního roku. Dnes se proto podíváme, zda na seznamu ohrožených profesí najdeme i datové analytiky. ChatGPT si totiž dokáže poradit i s SQL, Pythonem a R kódováním. A s pomocí pluginu Code Interpreter můžete dokonce provádět analýzu dat a vytvářet grafy. Na první pohled by se tedy mohlo zdát, že datovým analytikům zvoní hrana. Ve skutečnosti to ale tak jednoduché není, jelikož generativní AI má stále jednu velkou Achillovu patu. Více o tom už v dnešní mňamce!

Web scraping – jak překonat nejčastější problémy | Mňamka #460

Web scraping – jak překonat nejčastější problémy | Mňamka #460

Data z webových stránek představují cenný zdroj informací snad pro každou firmu. Možností jejich využití je totiž celá řada – můžete např. sledovat ceny konkurence a na základě toho dynamicky upravovat ceny vlastní nebo provádět rozsáhlé průzkumy trhu a popularity jednotlivých produktů. No jo, jenže jak taková data získat? Mohli byste je samozřejmě sbírat ručně, mnohem lepší ale je vše zautomatizovat pomocí tzv. web scrapingu. To ovšem není jen tak. Podívejte se, na jaké problémy při tom můžete narazit a jak je překonat!

Jak na smysluplné vizualizace | Mňamka #459

Jak na smysluplné vizualizace | Mňamka #459

Data mluví jasně! Tedy až na případy, kdy to není pravda. Datové vizualizace mohou být mocným nástrojem pro srozumitelnou reprezentaci i dosti komplexních informací. Platí to ale pouze za předpokladu, že se při tvorbě grafů a dashboardů držíme těch nejlepších designových principů a best practices. I velmi jednoduchý graf totiž může být značně matoucí, pokud zvolíme např. nevhodné škálování os nebo jestliže si vybereme jen takové datové body, které podporují náš pohled na věc. Přečtěte si, na co si dát při tvorbě vizualizací pozor!