Keboola ZADARMO? Jasně, jde to. | Mňamka #85

BizzTreat začal a vyrostl s Keboolou. S jejich Connection (familiárně přezdívanou u nás “kábécéčko”) jsme realizovali opravdu hodně projektů. Pamatujeme doby, kdy na backendu byla mysql, SQL jsme psali v texťáku a jako CSVčko jsme ho uploadovalo do storage, abysme ho přes Postman mohli pustit. (modří vědí, ostatním se omlouvám, to víte, vzpomínky #jednookonezůstalosuchý). Connection vyrostla opravdu do enterprise-wide produktu. O to víc jsme rádi, že holky a kluci z Kebooly se rozhodli spustit pay-as-you-go subskripci, aby umožnili začít s KBC firmě / týmu každé velikosti.

Free Plan (jak ho vtipně nazvali) zahrnuje:

  • Jeden Keboola Connection Project
  • Neomezeně ETL/ELT workflows
  • SQL / Python Transformace
  • SQL / Python sandboxy (nazvané nově “Analytical workspaces”)
  • XS Snowflake backend
  • 250 GB data storage
  • 300 minut / 5 time kreditů na spouštění jobů
  • $8.40 za každý další time kredit (hodinu běhu jobů)

Pojďme se na tuto nabídku podívat podrobněji.

Jeden Keboola Connection Project

Pokud jste menší firma, jeden malý tým analytický tým, nepotřebujete řešit přístupová práva jednotlivých členů týmu / jiných týmů apod. tak s jedním projektem vystačíte. Aspoň na začátku. V BizzTreat jsme fůru BI projektů začínali v jediném KBC Projectu. Tohle omezení vám na začátku rozhodně nebude překážet.

Neomezeně ETL/ELT workflows

Super. Tohle nic nestojí, takže ok. Jen si neodpustím rejpnutí: Jak Connection realizuje ELT koncept, když je to klasický ETL nástroj? Asi mi něco uniká, ale třeba se to brzy dozvíme.

SQL / Python transformace

Free Plan je omezený pouze na XS Snowflake backend v EU regionu Azure. Při inicializaci projektu můžete dokonce použít svůj vlastní Snowflake účet, takže nemusíte být výkonnostně omezeni pouze na XS warehouse, ale bohužel vám to nijak nezlevní cenu kreditu / minuty. Naše zkušenost je, že pro menší projekty je XS velikost Snowflake warehouse úplně dostačující. Pokud neděláte transformace v reálném čase (ELT), pak je vám obvykle celkem jedno, jestli job běží hodinu nebo dvě, pokud se celý update vejde do nočního okna zpracování a business má v 8 ráno data ready. Takže tady palec nahoru.

Python transformace bohužel stále zůstávají omezené na 1 vCPU a 8GB RAM, což na většinu Python transformací bohužel nestačí a tak zůstává Python ve Free Planu spíše na hraní, než seriozní práci. Zadarmo na vyzkoušení ale tahle konfigurace stačí.

Ještě jedna poznámka k XS. Oficiální web uvádí, že Free Plan pracuje pouze s XS warehousem, Když si ale vytvoříte Workspace (dříve Sandbox), uvádí jej UI jako “Small”. Po přihlášení do Workspace zjistíte, že je tam opravdu pouze XS, takže se nenechte unést, že v SQL workspace máte k dispozici ve skutečnosti S warehouse.

Storage

250GB je dost. Nebojte. Na začátku se do nich vejdete, protože Snowflake umí data opravdu pěkně komprimovat. Bohužel pricing page Kebooly neříká, co se stane, když se do 250GB nevejdete? Zastaví se joby, jako v případě vyčerpání time kreditů? Nebo je nutné upgradovat na Enterprise? Možnost připlatit si bohužel oficiální ceník neuvádí, tak doufejme, že ji Kebooláci brzo doplní. Byla by škoda, kdyby ne.

300 minut / 5 time kreditů na spouštění jobů

Je to málo? Je to dost? Stačí to na seriozní práci? Bohužel narozdíl od Enterprise verze Connection  se do kreditů ve Free Planu započítávají opravdu všechny joby, tj. např. i loadování dat do Workspace (Sandboxu) a dokonce i spouštění queries ve Workspace (to se mi bohužel nepodařilo přesně otestovat, ale Keboola tohle měla dlouhodobě v plánu). Takže pokud máte denně 10 minut na všechny joby, brzy zjistíte, že se do 300 minut nevejdete ani s jednomužným vývojem, natož s vaší denní orchestrací. Nepříjemné je bohužel to, že každý job má poměrně velký overhead, který také platíte. Když např. stahujete data z Google Analytics, vlastní dotaz do GA trvá např. 3sec., ale za celý job zaplatíte 59sec.

Škoda. Asi by se spíš měl plán jmenovat Pay-As-You-Go než Free Plan, protože ve skutečnosti platíte $8.40 za hodinu běhu vašich jobů a k tomu dostanete prvních 5 hodin měsíčně zdarma. Nevadí, i tak je tahle nabídka pro řadu týmů velmi zajímavá.

Co mě hodně mrzí, je, že Keboola vám bohužel nedává absolutně žádné možnosti, jak svoji útratu v Pay-As-You-Go plánu řídit, zjišťovat, co vás kolik stojí apod. Jediné, co funguje je, že když vyčerpáte svůj kredit, tak se joby zastaví do doby, než si připlatíte. Tak aspoň tak.

Závěrem

Pay-As-You-Go subskripce Keboola Connection je rozhodně zajímavý počin, kterému hodně fandíme. Znamená, že tenhle super ETL tool původem z českých luhů a hájů (teda spíš z Karlína a Holešovic) je dostupnější mnohem širšímu okruhu potenciálních zákazníků. Uvidíme, jaké budou zkušenosti z praxe. Jen doufáme, že celé nastavení podmínek umožní menším týmům pracovat v jim dostupných rozpočtech a nepovedou jen k neustálé “příležitosti pro upgrade”.

Tak co? Už máte zaregistrovaný svůj Keboola Free Plan projekt? Ne? Tak šup šup, Keboola slibuje dárky pro early birds registrace.

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Radovan Jirka
datový detektiv
LinkedIn

6 let... Cesta Bizztreatu k Bizzflow a dál...

6 let... Cesta Bizztreatu k Bizzflow a dál...

Je květen 2021 – před šesti lety jsme odstartovali cestu Bizztreatu. Od prvního dne se zaměřujeme na profesionální služby pro naše klienty. Transparentnost, nezávislost a rychlost dodání vždycky byly naši silnou stránkou. Dnes jsme tým třiceti skvělých lidí. Tuto cestu milujeme a jdeme dál!

BI je mrtvé! Ať žije Data as a Service! | Mňamka #168

BI je mrtvé! Ať žije Data as a Service! | Mňamka #168

Data as a Service má potenciál zásadně proměnit využití dat v businessu. Můžeme si ho představit jako koncept, jak stavět architekturu služeb, produktů, a firem tak, že data jsou dostupná a využitelná kdykoli, kýmkoli, jakýmkoliv způsobem. Data správná, aktuální, spolehlivá. Měli jsme tu excely, pak přišly BI nástroje jako Tableau nebo Power BI. Jenže vize headless BI míří jiným směrem. Rado sepsal svůj pohled na věc.

Design Pattern #5: Transakční data | Mňamka #165

Design Pattern #5: Transakční data | Mňamka #165

Transakční data si asi umí představit každý. Hromada řádků z eshopu, to je přece jasný. Spočítat revenue je přece hračka... jenže pak to přijde. Na každý řádek jiná sleva, jinak datum, teď které datum?, slevy na položku, slevy na fakturu, slevový kupón, s dopravou nebo bez? a tak dále. Denní chléb datového detektiva. Skvěle vám poslouží tyto tři designové patterny, které usnadní zpracování transakčních dat. Stačí se zorientovat v databázi!