Když se bere kanón na mouchu | Mňamka #52
Štěstí přeje připraveným
Ještě si živě pamatuju, když všechny moje projekty v Pythonu začínaly následujícími řádkami:

Přišlo mi to neprůstřelný. Nemůže mi přece chybět žádný modul, když je tam mám všechny. Četné nadávky linteru jsem ignoroval s myšlenkou: Já přece vím, co používám. Na první pohled je z importů zřejmé, že se jednalo o aplikaci, která pracovala se souborovým systémem, konkrétně pak s daty ve formátech JSON a CSV. Navíc docela nízkoúrovňově přistupovala k síti, s daty dělala nějakou tu dejta sájenc a byla to… hra?
Moje teorie byla taková, že když během kódění zjistím, že něco potřebuju, už to prostě rovnou budu mít. Štěstí přeje připraveným, ne?
Na zkoušku jsem vytvořil venv a nahrál do něj pomocí pip výše zmíněné balíčky. Prázdný venv má u mě kolem 7 MB, po nainstalování balíčků to bylo 150 MB. Samotný pandas má po instalaci všech závislostí (jako je třeba numpy) 113 MB. Dneska nikoho megabajt sem nebo megabajt tam úplně netrápí; v době, kdy váš repozitář může existovat v nesčetně kopiích napříč datovými centry a CDN po celém světě, a nikdo jeho 113 MB pandasu a jeden prázdný soubor s názvem hello-world.py nezaznamená, se to může zdát jako zbytečná buzerace, ale já když vidím ve skriptu na převedení TSV do CSV na začátku import pandas as pd, většinou se zhluboka nadechnu a začnu dělat problémy.
Orat se dá lecčím
Když zjistíte, že se vaším nosem dá tak trochu orat v zemi, stejně si radši na pole pořídíte třeba rádlo. A stejně je to s pandasem. Ono se to dá použít na otevření CSV. Ale ono to k tomu není primárně určené. pandas je jako švýcarák, a setsakramentsky dobrej švýcarák, ale víno se prostě většinou otevírá líp vývrtkou.
Může to vypadat, že jsem si zasedl na pandas; já opravdu vím, že je to skvělý balík modulů. Ale z mé zkušenosti se občas používá moc. Na srazu dejta sájentistů si musí pandas připadat trochu jako jediná žena na gang bangu.
Každý sklízí, co zasel
V Bizztreat jsem se naučil jedno strašně pěkný pravidlo - používej správný nástroj na požadovanou činnost.

O hodinu později koukám, co se hergot děje, že se mi ten obraz nechce a nechce sestavit. Nahlédnu do Dockerfile a představuji si, že takhle nějak vypadaly myšlenky autora:
- Tom říkal, ať ty obrazy děláme malý, postavím to na Alpine Linux.
- Moje appka používá pandas, tak teda pip install pandas.
- Ahá, ono to na Alpine nejde, tak já tam přidám závislosti pro sestavování C knihoven pro Python.
- pip install pandas
- Ty jo, trvá to docela dlouho, ale sestavilo se to.
- Hotovka libovka.
A na co appka ten pandas potřebuje?
Zjišťuje záhlaví céesvéčka.
Až se ucho utrhlo
Abych nebyl jenom za nerváka, co nadává na pandas, takhle prosím se dá docela snadno otevřít céescvéčko bez něj:

Tom
Jak na pavučinové grafy | Mňamka #437
Pavučinové (neboli paprskové) grafy patří k nejimpozantnějším grafům, se kterými se v moderních byznysových vizualizacích můžete setkat. Hodí se např. k porovnání dvou produktů na základě široké škály různých ukazatelů. Nebo jsou hojně využívány ve sportovní analytice ke komparativnímu srovnání výkonů jednotlivých hráčů. Pro nezasvěcené publikum ale mohou být jen obtížně stravitelné. Dnes si proto ukážeme, jakých zásad se při vytváření pavučinových grafů držet a jak se v nich co nejlépe orientovat!
5 mýtů o cloudu | Mňamka #436
Řešit data v cloudu dává smysl čím dál většímu počtu firem. A není se čemu divit, cloud totiž nabízí neuvěřitelnou flexibilitu a jednoduchost použití. Přesto se ale stále najde spousta firem, které jedou kompletně on-premise a s přechodem na cloud váhají. Někdy má takové rozhodnutí objektivní důvody, často ale bývá spíše výsledkem mylných představ, které o cloudových datových skladech panují. A právě na to si posvítíme v této mňamce. Pojďte se se spolu s námi podívat na 5 nejčastějších mýtů o cloudu!
Pandas – k čemu slouží, k čemu jej raději nepoužijeme a jeho alternativy | Mňamka #435
Pandas je jednou z nejpoužívanějších knihoven pro zpracování dat v jazyce Python. Jeho největší předností je zejména jednoduchá a intuitivní syntaxe a také rychlost, se kterou můžete zpracovávat velké datové soubory. V BizzTreatu ho proto často využíváme např. pro ad hoc analýzy dat, kdy potřebujeme rychle prozkoumat, jak data vlastně vypadají a jaká je jejich kvalita. V dnešní mňamce od Báry si ukážeme, kde všude lze Pandas použít a jak si stojí v porovnání s ostatními knihovnami!