Keboola ZADARMO? Jasně, jde to. | Mňamka #85

BizzTreat začal a vyrostl s Keboolou. S jejich Connection (familiárně přezdívanou u nás “kábécéčko”) jsme realizovali opravdu hodně projektů. Pamatujeme doby, kdy na backendu byla mysql, SQL jsme psali v texťáku a jako CSVčko jsme ho uploadovalo do storage, abysme ho přes Postman mohli pustit. (modří vědí, ostatním se omlouvám, to víte, vzpomínky #jednookonezůstalosuchý). Connection vyrostla opravdu do enterprise-wide produktu. O to víc jsme rádi, že holky a kluci z Kebooly se rozhodli spustit pay-as-you-go subskripci, aby umožnili začít s KBC firmě / týmu každé velikosti.

Free Plan (jak ho vtipně nazvali) zahrnuje:

  • Jeden Keboola Connection Project
  • Neomezeně ETL/ELT workflows
  • SQL / Python Transformace
  • SQL / Python sandboxy (nazvané nově “Analytical workspaces”)
  • XS Snowflake backend
  • 250 GB data storage
  • 300 minut / 5 time kreditů na spouštění jobů
  • $8.40 za každý další time kredit (hodinu běhu jobů)

Pojďme se na tuto nabídku podívat podrobněji.

Jeden Keboola Connection Project

Pokud jste menší firma, jeden malý tým analytický tým, nepotřebujete řešit přístupová práva jednotlivých členů týmu / jiných týmů apod. tak s jedním projektem vystačíte. Aspoň na začátku. V BizzTreat jsme fůru BI projektů začínali v jediném KBC Projectu. Tohle omezení vám na začátku rozhodně nebude překážet.

Neomezeně ETL/ELT workflows

Super. Tohle nic nestojí, takže ok. Jen si neodpustím rejpnutí: Jak Connection realizuje ELT koncept, když je to klasický ETL nástroj? Asi mi něco uniká, ale třeba se to brzy dozvíme.

SQL / Python transformace

Free Plan je omezený pouze na XS Snowflake backend v EU regionu Azure. Při inicializaci projektu můžete dokonce použít svůj vlastní Snowflake účet, takže nemusíte být výkonnostně omezeni pouze na XS warehouse, ale bohužel vám to nijak nezlevní cenu kreditu / minuty. Naše zkušenost je, že pro menší projekty je XS velikost Snowflake warehouse úplně dostačující. Pokud neděláte transformace v reálném čase (ELT), pak je vám obvykle celkem jedno, jestli job běží hodinu nebo dvě, pokud se celý update vejde do nočního okna zpracování a business má v 8 ráno data ready. Takže tady palec nahoru.

Python transformace bohužel stále zůstávají omezené na 1 vCPU a 8GB RAM, což na většinu Python transformací bohužel nestačí a tak zůstává Python ve Free Planu spíše na hraní, než seriozní práci. Zadarmo na vyzkoušení ale tahle konfigurace stačí.

Ještě jedna poznámka k XS. Oficiální web uvádí, že Free Plan pracuje pouze s XS warehousem, Když si ale vytvoříte Workspace (dříve Sandbox), uvádí jej UI jako “Small”. Po přihlášení do Workspace zjistíte, že je tam opravdu pouze XS, takže se nenechte unést, že v SQL workspace máte k dispozici ve skutečnosti S warehouse.

Storage

250GB je dost. Nebojte. Na začátku se do nich vejdete, protože Snowflake umí data opravdu pěkně komprimovat. Bohužel pricing page Kebooly neříká, co se stane, když se do 250GB nevejdete? Zastaví se joby, jako v případě vyčerpání time kreditů? Nebo je nutné upgradovat na Enterprise? Možnost připlatit si bohužel oficiální ceník neuvádí, tak doufejme, že ji Kebooláci brzo doplní. Byla by škoda, kdyby ne.

300 minut / 5 time kreditů na spouštění jobů

Je to málo? Je to dost? Stačí to na seriozní práci? Bohužel narozdíl od Enterprise verze Connection  se do kreditů ve Free Planu započítávají opravdu všechny joby, tj. např. i loadování dat do Workspace (Sandboxu) a dokonce i spouštění queries ve Workspace (to se mi bohužel nepodařilo přesně otestovat, ale Keboola tohle měla dlouhodobě v plánu). Takže pokud máte denně 10 minut na všechny joby, brzy zjistíte, že se do 300 minut nevejdete ani s jednomužným vývojem, natož s vaší denní orchestrací. Nepříjemné je bohužel to, že každý job má poměrně velký overhead, který také platíte. Když např. stahujete data z Google Analytics, vlastní dotaz do GA trvá např. 3sec., ale za celý job zaplatíte 59sec.

Škoda. Asi by se spíš měl plán jmenovat Pay-As-You-Go než Free Plan, protože ve skutečnosti platíte $8.40 za hodinu běhu vašich jobů a k tomu dostanete prvních 5 hodin měsíčně zdarma. Nevadí, i tak je tahle nabídka pro řadu týmů velmi zajímavá.

Co mě hodně mrzí, je, že Keboola vám bohužel nedává absolutně žádné možnosti, jak svoji útratu v Pay-As-You-Go plánu řídit, zjišťovat, co vás kolik stojí apod. Jediné, co funguje je, že když vyčerpáte svůj kredit, tak se joby zastaví do doby, než si připlatíte. Tak aspoň tak.

Závěrem

Pay-As-You-Go subskripce Keboola Connection je rozhodně zajímavý počin, kterému hodně fandíme. Znamená, že tenhle super ETL tool původem z českých luhů a hájů (teda spíš z Karlína a Holešovic) je dostupnější mnohem širšímu okruhu potenciálních zákazníků. Uvidíme, jaké budou zkušenosti z praxe. Jen doufáme, že celé nastavení podmínek umožní menším týmům pracovat v jim dostupných rozpočtech a nepovedou jen k neustálé “příležitosti pro upgrade”.

Tak co? Už máte zaregistrovaný svůj Keboola Free Plan projekt? Ne? Tak šup šup, Keboola slibuje dárky pro early birds registrace.

Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)

Radovan Jirka
datový detektiv
LinkedIn

Power BI Bookmarks II. – tvorba filtrovacího panelu | Mňamka #385

Power BI Bookmarks II. – tvorba filtrovacího panelu | Mňamka #385

Jak si v Power BI vytvořit záložky? Máme tady pokračování naší krátké minisérie o záložkách od Terky. V minulém díle jsme si udělali generální úklid v sekci Selection a dnes už se tak konečně můžeme pustit do samotné tvorby záložek. Vše si přitom demonstrujeme pěkně krok po kroku na jednoduchém příkladu tvorby filtrovacího panelu, který se na stránce zobrazí při stisku ikony filtru. Další praktické příklady si pak ukážeme v závěrečném díle našeho průvodce po záložkách, kde se zároveň podíváme i na jejich limity a omezení. Tak jdeme na to!

Code review – proč jej děláme a proč je důležité? | Mňamka #382

Code review – proč jej děláme a proč je důležité? | Mňamka #382

Pro někoho je code review neboli kontrola změn kódu zbytečnost, která jen zpomaluje práci na projektu. Pro nás je to ale základní součást firemních good practices. Jedině tak si totiž můžeme být jisti, že se do produkčního kódu nedostanou chyby. Správně nastavený proces code review vedle toho ale také podporuje týmovou spolupráci a zastupitelnost na projektech. I sebelepší kód vám je totiž k ničemu, když mu rozumí jen jediný člověk. Podívejte se proto, jak takové code review v BizzTreat vypadá!

Power BI Bookmarks I. – základní principy | Mňamka #379

Power BI Bookmarks I. – základní principy | Mňamka #379

Chcete si jednoduše přizpůsobit vizuály v Power BI podle svých aktuálních potřeb? Například si stejná data zobrazit v tabulce nebo ve sloupcovém grafu, podle toho, co vám zrovna více vyhovuje? Tak to jste na správném místě. Terka pro vás sepsala krátkou minisérii o záložkách neboli bookmarks, které vám právě takovou interaktivitu reportů v Power BI umožňují. V prvním díle si nejprve osvětlíme základní principy fungování záložek a poté si ukážeme, jak udělat generální úklid okna „selection“.