Práce s daty

Nic nemusí být takové, jak se nám zdá. | Mňamka #46

Nic nemusí být takové, jak se nám zdá. | Mňamka #46

(Nejen) datoví analytici si musí dávat pozor na tzv. kognitivní zkreslení. Jde o nevědomé tendence myšlení, díky kterým může docházet k chybných úsudkům. Rozeznat a uvědomit si tyto "cognitive biases" je jednou ze základních skills v datařině.

Základní datové typy | Mňamka #41

Základní datové typy | Mňamka #41

Datové typy. Jeden ze základních stavebních kamenů datové analytiky a programování vůbec. Správná klasifikace datového typu nám ulehčí spoustu budoucích troubles. Tak se na to pojďme podívat. A jak už je zvykem, přidali jsme i pár zajímavých odkazů s problematikou.

Design Patterns #3: is_deleted / last_modified | Mňamka #38

Design Patterns #3: is_deleted / last_modified | Mňamka #38

Nikdy, nikdy, nikdy nemažeme záznamy z databáze! A naopak vždy označujeme poslední změnu timestampou. Proč? A pokud k tomu přece jen dojde, tak co s tím? To si pojďme říct v dnešní mňamce.

A tohle je co za SQL? | Mňamka #32

A tohle je co za SQL? | Mňamka #32

Každá databáze může používat trošku jinak strukturovaný jazyk SQL. Čert aby se v tom občas vyznal. Jedna z cest, jak si ověřit, že naše SQL je správné nebo kde se přibližuje nějakému "standardu" té či oné databáze, je používat tzv. SQL validátory.

Design Patterns #2: měna účetnictví / měna operace | Mňamka #23

Design Patterns #2: měna účetnictví / měna operace | Mňamka #23

Fungujete v několika měnách najednou? Pak je potřeba u každého záznamu vždy uvádět měnu účetnictví i měnu operace/transakce spolu s kurzem v době vzniku události. Proč? Vyhnete se tak nepřesnostem, které vznikají z kurzových rozdílů. Jak si na to šikovně připravit data vám ukážu v dnešním článku. Je tu Design Patterns #2.

Design Patterns #1: Referenční integrita a chybějící hodnoty | Mňamka #18

Design Patterns #1: Referenční integrita a chybějící hodnoty | Mňamka #18

Proč? Protože když si připravujeme raw data pro analýzu, taková sada best practices se sakra hodí! Ono v podstatě každý jednoduchý trik, který nám ulehčí práci je dost vítaný. Minimalizuje čas strávený uklízením nepořádku, usnadní tvorbu metrik a reportů a nám, datovým detektivům, pomohou odhalit nesrovnalosti na první pohled.