Dávná rada od Padáka | Mňamka #43
Transformace se nezdařila. What??! Ok, tak teda znova. Kde že je ta chyba? Aha, na řádku 770000 potřebuju "R" vyměnit za ";". No ******** ! ... Tak tohle zná snad každý, kdo někdy prováděl transformaci. Pro začínající analytičku samo o sobě celkem flustrující. A co teprve, když to CSV má 4GB a opravdu s ním není lehká "manipulace". Doteď si pamatuju tu opakující se velkou nekonečnou zoufalost :-) A pak přišla tahle rada jako dar z nebes od mého tehdejšího mentora - Tomáše Mátla.
Základní příprava dat a Padákův deníček
Znáte blog Petra Šimečka z Keboola "Padákův deníček"? Kdo ne, tak vřele doporučuji si ho projít a přečíst. Najdete tam hodně zajímavého, hlavně pokud pracujete s Keboola. Ale zpátky k tématu - jak tedy naložit s velkým CSV, kde je na řádku 770000 chyba - a buhví kde ještě? Odpověď se jmenuje: Základní příprava dat v konzoli od Petra. Najdete tam několik rad, jak si připravit data v konzoli na serveru, včetně rady, jak získat levně server, na kterém si můžete hrát.

A takhle vypadalo to tehdejší řešení od Petra. Jsou prostě rady, na které se nazapomíná a měly by se tesat do kamene! :-)
Eva
MS Fabric: Pojďte si s námi vytvořit první pipeline - 2.část | Mňamka #541
Otevřeli jste poprvé MS Fabric a vůbec se nerorientujete? Už máte zadání a nevíte kam dřív? V tom případě jste tady správně, protože vás provedeme prvními krůčky, jak si dotáhnout do Fabricu první data, zpracovat je a nastavit celý proces v jednoduché pipeline. Ukažte ostatním, jak se to dělá! V tomto článku si představíme konkrétně kroky jako kopírování dat, dataflow, notebooky a zprovoznění pipeline.
MS Fabric: Pojďte si s námi vytvořit první pipeline - 1.část | Mňamka #540
Otevřeli jste poprvé MS Fabric a vůbec se nerorientujete? Už máte zadání a nevíte kam dřív? V tom případě jste tady správně, protože vás provedeme prvními krůčky, jak si dotáhnout do Fabricu první data, zpracovat je a nastavit celý proces v jednoduché pipeline. Ukažte ostatním, jak se to dělá! V tomto článku si představíme konkrétně kroky jako kopírování dat, dataflow, notebooky a zprovoznění pipeline.