Statistika

Statistika je o tom, jak shromažďovat, analyzovat, interpretovat a prezentovat data:

  • Co je nejčastější ?
  • Co je nejvíce očekávané?
  • Co je nejnormálnější?

Inferenční statistika

Inferenční statistiky jsou metody pro kvantifikaci vlastností populace z malého vzorku :

Vezmete data ze vzorku a provedete předpověď o celé populaci.

Můžete se například postavit do obchodu a zeptat se vzorku 100 lidí , zda mají rádi čokoládu.

Z vašeho výzkumu pomocí odvozených statistik můžete předpovědět, že 91 % všech nakupujících má rádo čokoládu.


Neuvěřitelná fakta o čokoládě

Devět z deseti lidí miluje čokoládu.

50 % populace USA nemůže žít bez čokolády každý den.


Deskriptivní statistika

Popisné statistiky jsou metody pro shrnutí pozorování do informací, kterým rozumíme.

Protože registrujeme každé nově narozené miminko, můžeme říci, že 51 ze 100 jsou chlapci.

Z čísel, která jsme shromáždili, můžeme předpovědět 51% šanci, že nové miminko bude chlapeček.

Je záhadou, že tento poměr není 50 %, jak by předpovídala základní biologie. Můžeme jen říci, že tento nakloněný poměr pohlaví máme alespoň od 17. století.


Střední hodnoty

Střední hodnota je průměrem všech hodnot.

Tato tabulka obsahuje ceny domů v závislosti na velikosti:

Cena7889991011141415
Velikost5060708090100 110120130140150

Průměrná cena je (7+8+8+9+9+9+10+11+14+14+15)/11 = 10,363636.

Jak na to : Sečtěte všechna čísla a poté je vydělte počtem čísel.

Průměr je součet dělený počtem . _

Střední hodnota (v JavaScriptu):

var mean = (7+8+8+9+9+9+10+11+14+14+15)/11;

Nebo pokud používáte matematickou knihovnu jako math.js :

var mean = math.mean([7,8,8,9,9,9,10,11,14,14,15]);


Rozptyl

Ve statistice je rozptyl průměrem kvadrátů rozdílů od střední hodnoty.

Jinými slovy, popisuje, jak daleko je soubor čísel rozložen od jejich průměrné hodnoty.

Rozdíl (v JavaScriptu):

// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+14+15)/11;

// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;

// Calculate the Variance
var variance = ss / 11;

Nebo pokud používáte matematickou knihovnu jako math.js :

var variance = math.variance([7,8,8,9,9,9,10,11,14,14,15],"uncorrected");


Standardní odchylka

Standardní odchylka je měřítkem toho, jak jsou čísla rozložená.

Symbol je σ (řecké písmeno sigma).

Vzorec je rozptyl (druhá odmocnina rozptylu).

Standardní odchylka je (v JavaScriptu):

// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+15)/11;

// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;

// Calculate the Variance
var variance = ss / 11;

// Calculate the Standard Deviation
var std = Math.sqrt(variance);

Nebo pokud používáte matematickou knihovnu jako math.js :

var std = math.std([7,8,8,9,9,9,9,10,11,14,15],"uncorrected");


Normální distribuce

Křivka normálního rozložení je křivka ve tvaru zvonu.

Každý pás křivky má šířku 1 standardní odchylka :

Standardní normální distribuce