Dávná rada od Padáka

Transformace se nezdařila. What??! Ok, tak teda znova. Kde že je ta chyba? Aha, na řádku 770000 potřebuju "R" vyměnit za ";". No ******** !  ... Tak tohle zná snad každý, kdo někdy prováděl transformaci. Pro začínající analytičku samo o sobě celkem flustrující. A co teprve, když to CSV má 4GB a opravdu s ním není lehká "manipulace". Doteď si pamatuju tu opakující se velkou nekonečnou zoufalost :-) A pak přišla tahle rada jako dar z nebes od mého tehdejšího mentora - Tomáše Mátla.   

Základní příprava dat a Padákův deníček

Znáte blog Petra Šimečka z Keboola "Padákův deníček"? Kdo ne, tak vřele doporučuji si ho projít a přečíst. Najdete tam hodně zajímavého, hlavně pokud pracujete s Keboola. Ale zpátky k tématu - jak tedy naložit s velkým CSV, kde je na řádku 770000 chyba - a buhví kde ještě? Odpověď se jmenuje: Základní příprava dat v konzoli od Petra. Najdete tam několik rad, jak si připravit data v konzoli na serveru, včetně rady, jak získat levně server, na kterém si můžete hrát. 

A takhle vypadalo to tehdejší řešení od Petra. Jsou prostě rady, na které se nazapomíná a měly by se tesat do kamene! :-)

Eva

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Eva Hankusová
detektiv nových příležitostí
LinkedIn

Když se bere kanón na mouchu

Když se bere kanón na mouchu

Přišlo mi to neprůstřelný. Nemůže mi přece chybět žádný modul, když je tam mám všechny. Moje teorie byla taková, že když během kódění zjistím, že něco potřebuju, už to prostě rovnou budu mít. Štěstí přeje připraveným, ne?

Co to je ten "Data Storytelling"?

Co to je ten "Data Storytelling"?

S pojmem "Data Storytelling" se setkáváme stále častěji - ano, zase další buzzword ze světa datařiny, za mě ale sakra důležitá část datové analýzy. Schovává se zde nejstarší kámen úrazu lidstva - komunikace. Nezaleží jen na tom, co ukazujeme, ale hlavně jak a komu to ukazujeme.

Design Patterns #4: Agregace long tail a ‘ostatní’

Design Patterns #4: Agregace long tail a ‘ostatní’

Pamatujete na video od Radovana: “Jak efektivně čistit data s Google Analytics?”. Dnes se k této mňamce ještě jednou vrátíme. Tentokrát jako Design pattern od Petry, schovaný pod pojmem “long tail”.