Keboola ZADARMO? Jasně, jde to. | Mňamka #85
BizzTreat začal a vyrostl s Keboolou. S jejich Connection (familiárně přezdívanou u nás “kábécéčko”) jsme realizovali opravdu hodně projektů. Pamatujeme doby, kdy na backendu byla mysql, SQL jsme psali v texťáku a jako CSVčko jsme ho uploadovalo do storage, abysme ho přes Postman mohli pustit. (modří vědí, ostatním se omlouvám, to víte, vzpomínky #jednookonezůstalosuchý). Connection vyrostla opravdu do enterprise-wide produktu. O to víc jsme rádi, že holky a kluci z Kebooly se rozhodli spustit pay-as-you-go subskripci, aby umožnili začít s KBC firmě / týmu každé velikosti.
Free Plan (jak ho vtipně nazvali) zahrnuje:
- Jeden Keboola Connection Project
- Neomezeně ETL/ELT workflows
- SQL / Python Transformace
- SQL / Python sandboxy (nazvané nově “Analytical workspaces”)
- XS Snowflake backend
- 250 GB data storage
- 300 minut / 5 time kreditů na spouštění jobů
- $8.40 za každý další time kredit (hodinu běhu jobů)
Pojďme se na tuto nabídku podívat podrobněji.
Jeden Keboola Connection Project
Pokud jste menší firma, jeden malý tým analytický tým, nepotřebujete řešit přístupová práva jednotlivých členů týmu / jiných týmů apod. tak s jedním projektem vystačíte. Aspoň na začátku. V BizzTreat jsme fůru BI projektů začínali v jediném KBC Projectu. Tohle omezení vám na začátku rozhodně nebude překážet.
Neomezeně ETL/ELT workflows
Super. Tohle nic nestojí, takže ok. Jen si neodpustím rejpnutí: Jak Connection realizuje ELT koncept, když je to klasický ETL nástroj? Asi mi něco uniká, ale třeba se to brzy dozvíme.
SQL / Python transformace
Free Plan je omezený pouze na XS Snowflake backend v EU regionu Azure. Při inicializaci projektu můžete dokonce použít svůj vlastní Snowflake účet, takže nemusíte být výkonnostně omezeni pouze na XS warehouse, ale bohužel vám to nijak nezlevní cenu kreditu / minuty. Naše zkušenost je, že pro menší projekty je XS velikost Snowflake warehouse úplně dostačující. Pokud neděláte transformace v reálném čase (ELT), pak je vám obvykle celkem jedno, jestli job běží hodinu nebo dvě, pokud se celý update vejde do nočního okna zpracování a business má v 8 ráno data ready. Takže tady palec nahoru.
Python transformace bohužel stále zůstávají omezené na 1 vCPU a 8GB RAM, což na většinu Python transformací bohužel nestačí a tak zůstává Python ve Free Planu spíše na hraní, než seriozní práci. Zadarmo na vyzkoušení ale tahle konfigurace stačí.
Ještě jedna poznámka k XS. Oficiální web uvádí, že Free Plan pracuje pouze s XS warehousem, Když si ale vytvoříte Workspace (dříve Sandbox), uvádí jej UI jako “Small”. Po přihlášení do Workspace zjistíte, že je tam opravdu pouze XS, takže se nenechte unést, že v SQL workspace máte k dispozici ve skutečnosti S warehouse.
Storage
250GB je dost. Nebojte. Na začátku se do nich vejdete, protože Snowflake umí data opravdu pěkně komprimovat. Bohužel pricing page Kebooly neříká, co se stane, když se do 250GB nevejdete? Zastaví se joby, jako v případě vyčerpání time kreditů? Nebo je nutné upgradovat na Enterprise? Možnost připlatit si bohužel oficiální ceník neuvádí, tak doufejme, že ji Kebooláci brzo doplní. Byla by škoda, kdyby ne.
300 minut / 5 time kreditů na spouštění jobů
Je to málo? Je to dost? Stačí to na seriozní práci? Bohužel narozdíl od Enterprise verze Connection se do kreditů ve Free Planu započítávají opravdu všechny joby, tj. např. i loadování dat do Workspace (Sandboxu) a dokonce i spouštění queries ve Workspace (to se mi bohužel nepodařilo přesně otestovat, ale Keboola tohle měla dlouhodobě v plánu). Takže pokud máte denně 10 minut na všechny joby, brzy zjistíte, že se do 300 minut nevejdete ani s jednomužným vývojem, natož s vaší denní orchestrací. Nepříjemné je bohužel to, že každý job má poměrně velký overhead, který také platíte. Když např. stahujete data z Google Analytics, vlastní dotaz do GA trvá např. 3sec., ale za celý job zaplatíte 59sec.
Škoda. Asi by se spíš měl plán jmenovat Pay-As-You-Go než Free Plan, protože ve skutečnosti platíte $8.40 za hodinu běhu vašich jobů a k tomu dostanete prvních 5 hodin měsíčně zdarma. Nevadí, i tak je tahle nabídka pro řadu týmů velmi zajímavá.
Co mě hodně mrzí, je, že Keboola vám bohužel nedává absolutně žádné možnosti, jak svoji útratu v Pay-As-You-Go plánu řídit, zjišťovat, co vás kolik stojí apod. Jediné, co funguje je, že když vyčerpáte svůj kredit, tak se joby zastaví do doby, než si připlatíte. Tak aspoň tak.
Závěrem
Pay-As-You-Go subskripce Keboola Connection je rozhodně zajímavý počin, kterému hodně fandíme. Znamená, že tenhle super ETL tool původem z českých luhů a hájů (teda spíš z Karlína a Holešovic) je dostupnější mnohem širšímu okruhu potenciálních zákazníků. Uvidíme, jaké budou zkušenosti z praxe. Jen doufáme, že celé nastavení podmínek umožní menším týmům pracovat v jim dostupných rozpočtech a nepovedou jen k neustálé “příležitosti pro upgrade”.
Tak co? Už máte zaregistrovaný svůj Keboola Free Plan projekt? Ne? Tak šup šup, Keboola slibuje dárky pro early birds registrace.
Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Radovan Jirka
datový detektiv
LinkedIn
Příběh transformace Crocodille ČR s Bizztreatem | Mňamka #495
🔊Jsme pyšný, že s vámi můžeme sdílej skutečný příběh, který píšeme už několik let s naším velkým klientem Crocodille ČR. Právě totiž vyšla nová epizoda Data Talku, ve které máme prostor vyprávět tento příběh! 💥 Reference je tou nejlepší zpětnou vazbou na naší práci, a tady ta reference zaznívá přímo od Jiřího Brothánka a dostává reálný hlas. 🥪 Jsme součástí transformace Crocodille ČR od počátečních někdy i bolestivých kroků, přes výzvy až po triumfy! Jiří Vicherek vede rozhovor s Jiřím Brothánkem, Head of IT v Crocodille, a naším team leaderem Tomášem Dědkem. Společně odhalují, jak jsme s Crocodille postupovali na cestě od tradičních business modelů k implementaci moderního BI a nyní i AI! 🕵️ Jsme hrdí, že můžeme být datovými detektivy pro jedny z hlavních hráčů na českém trhu.🎧Nenechte si tu epizodu ujít!
Zpracování dat z LinkedInu prostřednictvím ETL nástroje Bizzflow | Mňamka #494
Pro některé je LinkedIn pouze sociální sítí, na které mají svůj profesní profil, jen aby se neřeklo a pro některé může být LinkedIn jakási svatyně personal brandingu a navazování profesních kontaktů. Fakt, že LinkedIn generuje celosvětově až 80% B2B leadů ze všech sociálních sítí jen potvrzuje to, že zvláště pro firmy je LinkedIn skvělým místem, kde prezentovat svoje produkty či služby. V dnešní mňamce bych ráda mluvila o tom, jak jsem postupovala ve své bakalářské práci na téma Zpracování marketingových dat prostřednictvím ETL nástroje Bizzflow a v podstatě tak představit velmi krátký příběh, jak jsem se dostala z nápadu až k hotovému dashboardu.
Jaká byla zkušenost s průběhem certifikace Bizztreatu dle standardů ISO/IEC 27001🛡️? | Mňamka #489
Víte, co všechno obnáší certifikace ISO 27001 a jak je tento proces v různých organizacích odlišný? V našem nejnovějším článku vám přinášíme pohled na to, jaký byl proces certifikace u nás v Bizztreatu. Od analýzy a přípravy přes revizi a donastavení systému ISMS až po interní audit a finální externí certifikaci. Dozvíte se o spolupráci s externím partnerem, výzvách spojených s přípravou dokumentace a co vše obnášelo získání certifikace pro naši firmu. A jaký je výsledný dojem z celého procesu? Přečtěte si o tom, proč je certifikace ISO 27001 pouhým začátkem dlouhodobé cesty k zajištění bezpečnosti informací.