Keboola ZADARMO? Jasně, jde to. | Mňamka #85

BizzTreat začal a vyrostl s Keboolou. S jejich Connection (familiárně přezdívanou u nás “kábécéčko”) jsme realizovali opravdu hodně projektů. Pamatujeme doby, kdy na backendu byla mysql, SQL jsme psali v texťáku a jako CSVčko jsme ho uploadovalo do storage, abysme ho přes Postman mohli pustit. (modří vědí, ostatním se omlouvám, to víte, vzpomínky #jednookonezůstalosuchý). Connection vyrostla opravdu do enterprise-wide produktu. O to víc jsme rádi, že holky a kluci z Kebooly se rozhodli spustit pay-as-you-go subskripci, aby umožnili začít s KBC firmě / týmu každé velikosti.

Free Plan (jak ho vtipně nazvali) zahrnuje:

  • Jeden Keboola Connection Project
  • Neomezeně ETL/ELT workflows
  • SQL / Python Transformace
  • SQL / Python sandboxy (nazvané nově “Analytical workspaces”)
  • XS Snowflake backend
  • 250 GB data storage
  • 300 minut / 5 time kreditů na spouštění jobů
  • $8.40 za každý další time kredit (hodinu běhu jobů)

Pojďme se na tuto nabídku podívat podrobněji.

Jeden Keboola Connection Project

Pokud jste menší firma, jeden malý tým analytický tým, nepotřebujete řešit přístupová práva jednotlivých členů týmu / jiných týmů apod. tak s jedním projektem vystačíte. Aspoň na začátku. V BizzTreat jsme fůru BI projektů začínali v jediném KBC Projectu. Tohle omezení vám na začátku rozhodně nebude překážet.

Neomezeně ETL/ELT workflows

Super. Tohle nic nestojí, takže ok. Jen si neodpustím rejpnutí: Jak Connection realizuje ELT koncept, když je to klasický ETL nástroj? Asi mi něco uniká, ale třeba se to brzy dozvíme.

SQL / Python transformace

Free Plan je omezený pouze na XS Snowflake backend v EU regionu Azure. Při inicializaci projektu můžete dokonce použít svůj vlastní Snowflake účet, takže nemusíte být výkonnostně omezeni pouze na XS warehouse, ale bohužel vám to nijak nezlevní cenu kreditu / minuty. Naše zkušenost je, že pro menší projekty je XS velikost Snowflake warehouse úplně dostačující. Pokud neděláte transformace v reálném čase (ELT), pak je vám obvykle celkem jedno, jestli job běží hodinu nebo dvě, pokud se celý update vejde do nočního okna zpracování a business má v 8 ráno data ready. Takže tady palec nahoru.

Python transformace bohužel stále zůstávají omezené na 1 vCPU a 8GB RAM, což na většinu Python transformací bohužel nestačí a tak zůstává Python ve Free Planu spíše na hraní, než seriozní práci. Zadarmo na vyzkoušení ale tahle konfigurace stačí.

Ještě jedna poznámka k XS. Oficiální web uvádí, že Free Plan pracuje pouze s XS warehousem, Když si ale vytvoříte Workspace (dříve Sandbox), uvádí jej UI jako “Small”. Po přihlášení do Workspace zjistíte, že je tam opravdu pouze XS, takže se nenechte unést, že v SQL workspace máte k dispozici ve skutečnosti S warehouse.

Storage

250GB je dost. Nebojte. Na začátku se do nich vejdete, protože Snowflake umí data opravdu pěkně komprimovat. Bohužel pricing page Kebooly neříká, co se stane, když se do 250GB nevejdete? Zastaví se joby, jako v případě vyčerpání time kreditů? Nebo je nutné upgradovat na Enterprise? Možnost připlatit si bohužel oficiální ceník neuvádí, tak doufejme, že ji Kebooláci brzo doplní. Byla by škoda, kdyby ne.

300 minut / 5 time kreditů na spouštění jobů

Je to málo? Je to dost? Stačí to na seriozní práci? Bohužel narozdíl od Enterprise verze Connection  se do kreditů ve Free Planu započítávají opravdu všechny joby, tj. např. i loadování dat do Workspace (Sandboxu) a dokonce i spouštění queries ve Workspace (to se mi bohužel nepodařilo přesně otestovat, ale Keboola tohle měla dlouhodobě v plánu). Takže pokud máte denně 10 minut na všechny joby, brzy zjistíte, že se do 300 minut nevejdete ani s jednomužným vývojem, natož s vaší denní orchestrací. Nepříjemné je bohužel to, že každý job má poměrně velký overhead, který také platíte. Když např. stahujete data z Google Analytics, vlastní dotaz do GA trvá např. 3sec., ale za celý job zaplatíte 59sec.

Škoda. Asi by se spíš měl plán jmenovat Pay-As-You-Go než Free Plan, protože ve skutečnosti platíte $8.40 za hodinu běhu vašich jobů a k tomu dostanete prvních 5 hodin měsíčně zdarma. Nevadí, i tak je tahle nabídka pro řadu týmů velmi zajímavá.

Co mě hodně mrzí, je, že Keboola vám bohužel nedává absolutně žádné možnosti, jak svoji útratu v Pay-As-You-Go plánu řídit, zjišťovat, co vás kolik stojí apod. Jediné, co funguje je, že když vyčerpáte svůj kredit, tak se joby zastaví do doby, než si připlatíte. Tak aspoň tak.

Závěrem

Pay-As-You-Go subskripce Keboola Connection je rozhodně zajímavý počin, kterému hodně fandíme. Znamená, že tenhle super ETL tool původem z českých luhů a hájů (teda spíš z Karlína a Holešovic) je dostupnější mnohem širšímu okruhu potenciálních zákazníků. Uvidíme, jaké budou zkušenosti z praxe. Jen doufáme, že celé nastavení podmínek umožní menším týmům pracovat v jim dostupných rozpočtech a nepovedou jen k neustálé “příležitosti pro upgrade”.

Tak co? Už máte zaregistrovaný svůj Keboola Free Plan projekt? Ne? Tak šup šup, Keboola slibuje dárky pro early birds registrace.

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Radovan Jirka
datový detektiv
LinkedIn

Ze života datového detektiva I. - Průvodce světem dat

Ze života datového detektiva I. - Průvodce světem dat

Hodně často kolem sebe slýcháme otázku: a co že vy teda děláte? První díl z celkem čtyř o tom, jak datový detektiv funguje v každodenním životě. Naše práce je opravdu hodně komplexní a musíme zdatně propojovat analytické a businessové skills. Začneme tím, jak probíhá náš první kontakt se zákazníkem! Datový detektiv je totiž také obchoďák a accounťák. Eva a Rado vám umožní nahlédnout do svých běžných pracovních dnů. Co dělají? Jak probíhají první jednání s budoucími zákazníky a co je na tom baví?

Design pattern #6: Události v datech | Mňamka #237

Design pattern #6: Události v datech | Mňamka #237

Máme tu další várku design patternů od Péti! Pojďme si ukázat, jak můžeme pracovat s událostmi v datech - zajímá vás, co předcházelo zákaznické registraci? Průměrný počet dní mezi objednávkami? Nebo jak se mění zdroj návštěv u jednotlivých klientů? Tyhle patterny Vám pomůžou v pochopit vzorce chování jednotlivých zákazníků/skupin, nebo třeba odhalit mezery v akvizičním procesu. Není to nic složitého!

Self service BI aneb "naklikat to zvládnu sám" | Mňamka #234

Self service BI aneb "naklikat to zvládnu sám" | Mňamka #234

Právě jste došli k tomu, že by vám pomohlo, kdybyste trochu víc pracovali s daty. Jenže co teď? Kde začít? Stavět datový sklad? Nakoupit servery? V dnešní době spíš jít a zaregistrovat se do Snowflake nebo Google BigQuery. Jenže tohle je jen začátek. Úplný začátek. Celé datové řešení není jen o výběru vhodného nástroje… je to velmi komplexní projekt. Co je dobré zvážit, než uděláte pomyslný první krok?