Dávná rada od Padáka | Mňamka #43

Transformace se nezdařila. What??! Ok, tak teda znova. Kde že je ta chyba? Aha, na řádku 770000 potřebuju "R" vyměnit za ";". No ******** !  ... Tak tohle zná snad každý, kdo někdy prováděl transformaci. Pro začínající analytičku samo o sobě celkem flustrující. A co teprve, když to CSV má 4GB a opravdu s ním není lehká "manipulace". Doteď si pamatuju tu opakující se velkou nekonečnou zoufalost :-) A pak přišla tahle rada jako dar z nebes od mého tehdejšího mentora - Tomáše Mátla.   

Základní příprava dat a Padákův deníček

Znáte blog Petra Šimečka z Keboola "Padákův deníček"? Kdo ne, tak vřele doporučuji si ho projít a přečíst. Najdete tam hodně zajímavého, hlavně pokud pracujete s Keboola. Ale zpátky k tématu - jak tedy naložit s velkým CSV, kde je na řádku 770000 chyba - a buhví kde ještě? Odpověď se jmenuje: Základní příprava dat v konzoli od Petra. Najdete tam několik rad, jak si připravit data v konzoli na serveru, včetně rady, jak získat levně server, na kterém si můžete hrát. 

A takhle vypadalo to tehdejší řešení od Petra. Jsou prostě rady, na které se nazapomíná a měly by se tesat do kamene! :-)

Eva

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Eva Hankusová
detektiv nových příležitostí
LinkedIn

Nahradí AI datové analytiky? | Mňamka #461

Nahradí AI datové analytiky? | Mňamka #461

Koho všeho nahradí umělá inteligence? To je asi jedno z nejdiskutovanějších témat letošního roku. Dnes se proto podíváme, zda na seznamu ohrožených profesí najdeme i datové analytiky. ChatGPT si totiž dokáže poradit i s SQL, Pythonem a R kódováním. A s pomocí pluginu Code Interpreter můžete dokonce provádět analýzu dat a vytvářet grafy. Na první pohled by se tedy mohlo zdát, že datovým analytikům zvoní hrana. Ve skutečnosti to ale tak jednoduché není, jelikož generativní AI má stále jednu velkou Achillovu patu. Více o tom už v dnešní mňamce!

Web scraping – jak překonat nejčastější problémy | Mňamka #460

Web scraping – jak překonat nejčastější problémy | Mňamka #460

Data z webových stránek představují cenný zdroj informací snad pro každou firmu. Možností jejich využití je totiž celá řada – můžete např. sledovat ceny konkurence a na základě toho dynamicky upravovat ceny vlastní nebo provádět rozsáhlé průzkumy trhu a popularity jednotlivých produktů. No jo, jenže jak taková data získat? Mohli byste je samozřejmě sbírat ručně, mnohem lepší ale je vše zautomatizovat pomocí tzv. web scrapingu. To ovšem není jen tak. Podívejte se, na jaké problémy při tom můžete narazit a jak je překonat!

Jak na smysluplné vizualizace | Mňamka #459

Jak na smysluplné vizualizace | Mňamka #459

Data mluví jasně! Tedy až na případy, kdy to není pravda. Datové vizualizace mohou být mocným nástrojem pro srozumitelnou reprezentaci i dosti komplexních informací. Platí to ale pouze za předpokladu, že se při tvorbě grafů a dashboardů držíme těch nejlepších designových principů a best practices. I velmi jednoduchý graf totiž může být značně matoucí, pokud zvolíme např. nevhodné škálování os nebo jestliže si vybereme jen takové datové body, které podporují náš pohled na věc. Přečtěte si, na co si dát při tvorbě vizualizací pozor!