Statistika
Statistika je o tom, jak shromažďovat, analyzovat, interpretovat a prezentovat data:
- Co je nejčastější ?
- Co je nejvíce očekávané?
- Co je nejnormálnější?
Inferenční statistika
Inferenční statistiky jsou metody pro kvantifikaci vlastností populace z malého vzorku :
Vezmete data ze vzorku a provedete předpověď o celé populaci.
Můžete se například postavit do obchodu a zeptat se vzorku 100 lidí , zda mají rádi čokoládu.
Z vašeho výzkumu pomocí odvozených statistik můžete předpovědět, že 91 % všech nakupujících má rádo čokoládu.
Neuvěřitelná fakta o čokoládě
Devět z deseti lidí miluje čokoládu.
50 % populace USA nemůže žít bez čokolády každý den.
Deskriptivní statistika
Popisné statistiky jsou metody pro shrnutí pozorování do informací, kterým rozumíme.
Protože registrujeme každé nově narozené miminko, můžeme říci, že 51 ze 100 jsou chlapci.
Z čísel, která jsme shromáždili, můžeme předpovědět 51% šanci, že nové miminko bude chlapeček.
Je záhadou, že tento poměr není 50 %, jak by předpovídala základní biologie. Můžeme jen říci, že tento nakloněný poměr pohlaví máme alespoň od 17. století.
Střední hodnoty
Střední hodnota je průměrem všech hodnot.
Tato tabulka obsahuje ceny domů v závislosti na velikosti:
Cena | 7 | 8 | 8 | 9 | 9 | 9 | 10 | 11 | 14 | 14 | 15 |
Velikost | 50 | 60 | 70 | 80 | 90 | 100 | 110 | 120 | 130 | 140 | 150 |
Průměrná cena je (7+8+8+9+9+9+10+11+14+14+15)/11 = 10,363636.
Jak na to : Sečtěte všechna čísla a poté je vydělte počtem čísel.
Průměr je součet dělený počtem . _
Střední hodnota (v JavaScriptu):
var mean = (7+8+8+9+9+9+10+11+14+14+15)/11;
Nebo pokud používáte matematickou knihovnu jako math.js :
var mean = math.mean([7,8,8,9,9,9,10,11,14,14,15]);
Rozptyl
Ve statistice je rozptyl průměrem kvadrátů rozdílů od střední hodnoty.
Jinými slovy, popisuje, jak daleko je soubor čísel rozložen od jejich průměrné hodnoty.
Rozdíl (v JavaScriptu):
// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+14+15)/11;
// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;
// Calculate the Variance
var variance = ss / 11;
Nebo pokud používáte matematickou knihovnu jako math.js :
var variance = math.variance([7,8,8,9,9,9,10,11,14,14,15],"uncorrected");
Standardní odchylka
Standardní odchylka je měřítkem toho, jak jsou čísla rozložená.
Symbol je σ (řecké písmeno sigma).
Vzorec je √ rozptyl (druhá odmocnina rozptylu).
Standardní odchylka je (v JavaScriptu):
// Calculate the Mean (m)
var m = (7+8+8+9+9+9+10+11+14+15)/11;
// Calculate the Sum of Squares (ss)
var ss = (7-m)**2 + (8-m)**2 + (8-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (9-m)**2 + (10-m)**2 + (11-m)**2 + (14-m)**2 + (15-m)**2;
// Calculate the Variance
var variance = ss / 11;
// Calculate the Standard Deviation
var std = Math.sqrt(variance);
Nebo pokud používáte matematickou knihovnu jako math.js :
var std = math.std([7,8,8,9,9,9,9,10,11,14,15],"uncorrected");
Normální distribuce
Křivka normálního rozložení je křivka ve tvaru zvonu.
Každý pás křivky má šířku 1 standardní odchylka :