Dávná rada od Padáka | Mňamka #43

Transformace se nezdařila. What??! Ok, tak teda znova. Kde že je ta chyba? Aha, na řádku 770000 potřebuju "R" vyměnit za ";". No ******** !  ... Tak tohle zná snad každý, kdo někdy prováděl transformaci. Pro začínající analytičku samo o sobě celkem flustrující. A co teprve, když to CSV má 4GB a opravdu s ním není lehká "manipulace". Doteď si pamatuju tu opakující se velkou nekonečnou zoufalost :-) A pak přišla tahle rada jako dar z nebes od mého tehdejšího mentora - Tomáše Mátla.   

Základní příprava dat a Padákův deníček

Znáte blog Petra Šimečka z Keboola "Padákův deníček"? Kdo ne, tak vřele doporučuji si ho projít a přečíst. Najdete tam hodně zajímavého, hlavně pokud pracujete s Keboola. Ale zpátky k tématu - jak tedy naložit s velkým CSV, kde je na řádku 770000 chyba - a buhví kde ještě? Odpověď se jmenuje: Základní příprava dat v konzoli od Petra. Najdete tam několik rad, jak si připravit data v konzoli na serveru, včetně rady, jak získat levně server, na kterém si můžete hrát. 

A takhle vypadalo to tehdejší řešení od Petra. Jsou prostě rady, na které se nazapomíná a měly by se tesat do kamene! :-)

Eva

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, ráda to s Vámi proberu :-)

Eva Hankusová
detektiv nových příležitostí
LinkedIn

Seznamte se s Kats - jednotným kontaktním místem pro analýzu časových řad | Mňamka #203

Seznamte se s Kats - jednotným kontaktním místem pro analýzu časových řad | Mňamka #203

Pojďme se podívat na Kats – novou knihovnu v Pythonu pro analýzu časových řad! Kats je elegantně použitelný framework pro obecnou analýzu časových řad, včetně předpovědí nebo vícerozměrné analýzy a extrakce/vložení funkcí. Poskytuje klasické i pokročilé techniky pro modelování dat časových řad!

Jak si přidat vlastní KPIs do Airflow | Mňamka #202

Jak si přidat vlastní KPIs do Airflow | Mňamka #202

Airflow nám umožňuje programově vytvářet, plánovat a následně sledovat workflow. Standardní UI v Airflow nám umožňuje zobrazit pipelines a filtry. Jenže.. jak se zvyšuje počet pipelines, stává se mnohem složitější vyfiltrovat to, co potřebujeme. Jak si přidat vlastní pohledy/filtry na vaše DAGs v Airflow? Podívejte se, jak na to!

Jak využít Pohodu (a jiné datové zdroje) v BI? | Mňamka #201

Jak využít Pohodu (a jiné datové zdroje) v BI? | Mňamka #201

Vědět, v jaké je firma finanční kondici a kam pluje je jedna z klíčových věcí pro její správné kormidlování. Jenže jak to dát všechno dohromady? Jak využít všechny ty datové zdroje, které máme k dispozici? Potřebujete mít všechny finanční pohledy aktuální pár minut po zaúčtování dokladu? Pojďme se na to podívat krok za krokem – jen namátkově vytvoření mappingů, očištění dat, datový model a na závěr už chybí jen pár vymazlených dashboardů!