Keboola ZADARMO? Jasně, jde to. | Mňamka #85
BizzTreat začal a vyrostl s Keboolou. S jejich Connection (familiárně přezdívanou u nás “kábécéčko”) jsme realizovali opravdu hodně projektů. Pamatujeme doby, kdy na backendu byla mysql, SQL jsme psali v texťáku a jako CSVčko jsme ho uploadovalo do storage, abysme ho přes Postman mohli pustit. (modří vědí, ostatním se omlouvám, to víte, vzpomínky #jednookonezůstalosuchý). Connection vyrostla opravdu do enterprise-wide produktu. O to víc jsme rádi, že holky a kluci z Kebooly se rozhodli spustit pay-as-you-go subskripci, aby umožnili začít s KBC firmě / týmu každé velikosti.
Free Plan (jak ho vtipně nazvali) zahrnuje:
- Jeden Keboola Connection Project
- Neomezeně ETL/ELT workflows
- SQL / Python Transformace
- SQL / Python sandboxy (nazvané nově “Analytical workspaces”)
- XS Snowflake backend
- 250 GB data storage
- 300 minut / 5 time kreditů na spouštění jobů
- $8.40 za každý další time kredit (hodinu běhu jobů)
Pojďme se na tuto nabídku podívat podrobněji.
Jeden Keboola Connection Project
Pokud jste menší firma, jeden malý tým analytický tým, nepotřebujete řešit přístupová práva jednotlivých členů týmu / jiných týmů apod. tak s jedním projektem vystačíte. Aspoň na začátku. V BizzTreat jsme fůru BI projektů začínali v jediném KBC Projectu. Tohle omezení vám na začátku rozhodně nebude překážet.
Neomezeně ETL/ELT workflows
Super. Tohle nic nestojí, takže ok. Jen si neodpustím rejpnutí: Jak Connection realizuje ELT koncept, když je to klasický ETL nástroj? Asi mi něco uniká, ale třeba se to brzy dozvíme.
SQL / Python transformace
Free Plan je omezený pouze na XS Snowflake backend v EU regionu Azure. Při inicializaci projektu můžete dokonce použít svůj vlastní Snowflake účet, takže nemusíte být výkonnostně omezeni pouze na XS warehouse, ale bohužel vám to nijak nezlevní cenu kreditu / minuty. Naše zkušenost je, že pro menší projekty je XS velikost Snowflake warehouse úplně dostačující. Pokud neděláte transformace v reálném čase (ELT), pak je vám obvykle celkem jedno, jestli job běží hodinu nebo dvě, pokud se celý update vejde do nočního okna zpracování a business má v 8 ráno data ready. Takže tady palec nahoru.
Python transformace bohužel stále zůstávají omezené na 1 vCPU a 8GB RAM, což na většinu Python transformací bohužel nestačí a tak zůstává Python ve Free Planu spíše na hraní, než seriozní práci. Zadarmo na vyzkoušení ale tahle konfigurace stačí.
Ještě jedna poznámka k XS. Oficiální web uvádí, že Free Plan pracuje pouze s XS warehousem, Když si ale vytvoříte Workspace (dříve Sandbox), uvádí jej UI jako “Small”. Po přihlášení do Workspace zjistíte, že je tam opravdu pouze XS, takže se nenechte unést, že v SQL workspace máte k dispozici ve skutečnosti S warehouse.
Storage
250GB je dost. Nebojte. Na začátku se do nich vejdete, protože Snowflake umí data opravdu pěkně komprimovat. Bohužel pricing page Kebooly neříká, co se stane, když se do 250GB nevejdete? Zastaví se joby, jako v případě vyčerpání time kreditů? Nebo je nutné upgradovat na Enterprise? Možnost připlatit si bohužel oficiální ceník neuvádí, tak doufejme, že ji Kebooláci brzo doplní. Byla by škoda, kdyby ne.
300 minut / 5 time kreditů na spouštění jobů
Je to málo? Je to dost? Stačí to na seriozní práci? Bohužel narozdíl od Enterprise verze Connection se do kreditů ve Free Planu započítávají opravdu všechny joby, tj. např. i loadování dat do Workspace (Sandboxu) a dokonce i spouštění queries ve Workspace (to se mi bohužel nepodařilo přesně otestovat, ale Keboola tohle měla dlouhodobě v plánu). Takže pokud máte denně 10 minut na všechny joby, brzy zjistíte, že se do 300 minut nevejdete ani s jednomužným vývojem, natož s vaší denní orchestrací. Nepříjemné je bohužel to, že každý job má poměrně velký overhead, který také platíte. Když např. stahujete data z Google Analytics, vlastní dotaz do GA trvá např. 3sec., ale za celý job zaplatíte 59sec.
Škoda. Asi by se spíš měl plán jmenovat Pay-As-You-Go než Free Plan, protože ve skutečnosti platíte $8.40 za hodinu běhu vašich jobů a k tomu dostanete prvních 5 hodin měsíčně zdarma. Nevadí, i tak je tahle nabídka pro řadu týmů velmi zajímavá.
Co mě hodně mrzí, je, že Keboola vám bohužel nedává absolutně žádné možnosti, jak svoji útratu v Pay-As-You-Go plánu řídit, zjišťovat, co vás kolik stojí apod. Jediné, co funguje je, že když vyčerpáte svůj kredit, tak se joby zastaví do doby, než si připlatíte. Tak aspoň tak.
Závěrem
Pay-As-You-Go subskripce Keboola Connection je rozhodně zajímavý počin, kterému hodně fandíme. Znamená, že tenhle super ETL tool původem z českých luhů a hájů (teda spíš z Karlína a Holešovic) je dostupnější mnohem širšímu okruhu potenciálních zákazníků. Uvidíme, jaké budou zkušenosti z praxe. Jen doufáme, že celé nastavení podmínek umožní menším týmům pracovat v jim dostupných rozpočtech a nepovedou jen k neustálé “příležitosti pro upgrade”.
Tak co? Už máte zaregistrovaný svůj Keboola Free Plan projekt? Ne? Tak šup šup, Keboola slibuje dárky pro early birds registrace.
Máte k článku nějaké otázky nebo připomínky? Klidně mi napište, rád to s Vámi proberu :-)
Základní pojmy v datovém modelování | Mňamka #457
Co je to datový model? Jaký je rozdíl mezi konceptuálním a logickým modelem? A k čemu slouží proces tzv. normalizace? Bez datového modelování se dnes v BI obejdete už jen stěží, Kuba si o něm proto připravil krátkou minisérii, ve které si vše probereme od úplných základů. V prvním díle se seznámíme s nejdůležitějšími pojmy, které byste v této souvislosti měli znát, a na jednoduchém příkladu z oblasti sales si ukážeme, jak takový datový model vlastně vypadá. Tak pojďme na to!
MAQL II. - MAQL Reuse factů & Nesting metrik | Mňamka #454
Proč se vyplatí recyklovat metriky v MAQL? Máme tady pokračování naší krátké minisérie o dotazovacím jazyku MAQL od Péti. V minulém díle jsme si osvětlili základní rozdíl mezi SQL a MAQL a dnes se zaměříme na výhody metrik vytvořených pomocí MAQL a jejich recyklaci. Funguje to přitom podobně jako v případě klasické recyklace surovin. Pokud ji dělat nebudete, ušetříte si možná půl minutky práce, v budoucnu se vám to ale může velmi nepříjemně vrátit. Tak se na to pojďte podívat!
Šaty dělají kód aneb Proč je někdy lepší kebab než velbloud | Mňamka #441
I špatný standard může být lepší než žádný standard. Bez toho totiž ve vašem kódu velmi snadno zavládne chaos. V praxi se např. často stává, že lidé halabala kombinují různé druhy uvozovek, míchají malá a velká písmena v pojmenování proměnných nebo se pro jistotu vůbec žádných jmenných konvencí nedrží. Ostatně, Tomáš už se o tom mnohokrát přesvědčil na vlastní pěst. Sepsal pro vás proto mňamku, ve které si připomeneme, proč byste přece jen nějaký standard při psaní kódu mít měli!