MAQL II. - MAQL Reuse factů & Nesting metrik | Mňamka #454

Papír do modrého, plast do žlutého a barevné sklo do zeleného. Recyklujeme, abychom znovu využili suroviny a neplýtvali zdroji. Stejně tak je tomu i s daty. Pokud už někde máme zpracovaná data, ze kterých potřebujeme vycházet, můžeme je využít a ušetřit si čas i zdroje.

V minulém článku jsme si osvětlili rozdíl mezi SQL a MAQL. Jestli ještě nevíte, o čem mluvím, tak tady se můžete nachytřit. Dnes se trochu zaměříme na výhodu metrik vytvořených přes MAQL a jejich recyklaci. K čemu všemu nám mohou být metriky dobré?

Reuse factů

Když poprvé otevřu nástroj Analyzer v GoodDatě, může se zdát, že pro jednoduché agregační metriky mi bohatě stačí loupnout si nějaký fact, tedy číselnou hodnotu, rovnou do kolonky určené pro metriky. GoodData sama mi z factu metriku jednoduchou agregací vytvoří a já si ušetřila půl minuty práce. Teď. Ale v budoucnu mě to může taky spoustu času stát, a to úplně zbytečně.

Chytřejší řešení je totiž si z agregace factu, i z úplně jednoduchého, udělat nejprve metriku pomocí MAQL. Pokud totiž budu stejnou sumu mého factu, říkejme mu třeba Suma tržeb za malinové palačinky, využívat ve více než jednom insightu, a že se mi to dozajista časem stane, házím prakticky PET láhve do směsného odpadu.

Problém totiž přichází, když zjistím, že potřebuji napříč celým workspacem najít všechny tyhle moje Sumy tržeb za malinové palačinky a udělat z nich třeba Sumy tržeb za palačinky s lesním ovocem. To jsem dosti nahraná, protože výskyt metrik si můžu snadno dohledat, například přes GD extension, ale facta, nějak upravená jednotlivě pro každý insight stejně, najdu už hůře.

Když si to shrneme, použití metrik v insightech místo factu má následující výhody:

  • Nemusím upravovat fact několikrát stejně
  • Při změně na jednom místě se mi kaskádovitě změní všechny výskyty
  • Snadno dohledatelné použití metriky

Nesting metrik

Nesting metrik je použití metriky v metrice další. Funguje to tedy jako matrjošky, metriku zabalíme do jiné metriky a tuhle metriku opět můžeme zabalit do metriky další, a dokud nás to baví, můžeme pokračovat. Velkou výhodou je, že si nabalujeme logiku agregací či filtrů postupně a u složitějších metrik to nejen velmi zlepší přehlednost, ale i ušetří znovuvytváření stejného kódu. A v případě, že se zpětně potřebujeme vrátit a zjistit, co dělá nestovaná metrika, stačí nám jeden klik na ni, a to je velmi rychlé řešení.

Výhody nestingu metrik:

  • Mnohonásobné použití stejné logiky
  • Orientace ve složitějších metrikách
  • Změna v jedné metrice ovlivní kaskádovitě všechny ostatní

A co vy? Jste ekologičtí při stavbě metrik v GoodDatě?

Máte k článku nějaké otázky nebo připomínky? Klidně nám napište, rádi to s Vámi probereme :-)

Petra Nedvědová
datový detektiv
LinkedIn

Základní pojmy v datovém modelování | Mňamka #457

Základní pojmy v datovém modelování | Mňamka #457

Co je to datový model? Jaký je rozdíl mezi konceptuálním a logickým modelem? A k čemu slouží proces tzv. normalizace? Bez datového modelování se dnes v BI obejdete už jen stěží, Kuba si o něm proto připravil krátkou minisérii, ve které si vše probereme od úplných základů. V prvním díle se seznámíme s nejdůležitějšími pojmy, které byste v této souvislosti měli znát, a na jednoduchém příkladu z oblasti sales si ukážeme, jak takový datový model vlastně vypadá. Tak pojďme na to!

Šaty dělají kód aneb Proč je někdy lepší kebab než velbloud | Mňamka #441

Šaty dělají kód aneb Proč je někdy lepší kebab než velbloud | Mňamka #441

I špatný standard může být lepší než žádný standard. Bez toho totiž ve vašem kódu velmi snadno zavládne chaos. V praxi se např. často stává, že lidé halabala kombinují různé druhy uvozovek, míchají malá a velká písmena v pojmenování proměnných nebo se pro jistotu vůbec žádných jmenných konvencí nedrží. Ostatně, Tomáš už se o tom mnohokrát přesvědčil na vlastní pěst. Sepsal pro vás proto mňamku, ve které si připomeneme, proč byste přece jen nějaký standard při psaní kódu mít měli!

Využití dat v boji proti rakovině kůže | Mňamka #438

Využití dat v boji proti rakovině kůže | Mňamka #438

Rakovina kůže patří mezi nejčastější druhy nádorových onemocnění u nás. I přes značné pokroky v medicíně jde přitom stále o nemoc s poměrně vysokou úmrtností. Včasná diagnostika je proto naprosto klíčová. A právě zde hrají data čím dál větší roli. Jako velmi efektivní nástroj v boji proti rakovině se totiž ukázalo zejména strojové učení s využitím metody konvolučních neuronových sítí. Jaké jsou dosavadní výsledky a výzvy v této oblasti? To už se dozvíte v dnešní mňamce od Martina!