Strojové učení – normální distribuce dat
Normální distribuce dat
V předchozí kapitole jsme se naučili, jak vytvořit zcela náhodné pole o dané velikosti a mezi dvěma danými hodnotami.
V této kapitole se naučíme, jak vytvořit pole, kde jsou hodnoty soustředěny kolem dané hodnoty.
V teorii pravděpodobnosti je tento druh rozdělení dat známý jako normální rozdělení dat nebo Gaussovo rozdělení dat podle matematika Carla Friedricha Gausse, který přišel se vzorcem tohoto rozdělení dat.
Příklad
Typická normální distribuce dat:
import numpy
import matplotlib.pyplot as plt
x =
numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
Výsledek:
Poznámka: Graf normálního rozdělení je také známý jako zvonová křivka , protože má charakteristický tvar zvonu.
Histogram vysvětlen
Pole z numpy.random.normal()
metody s 100 000 hodnotami použijeme k vykreslení histogramu se 100 čárkami.
Uvádíme, že střední hodnota je 5,0 a směrodatná odchylka je 1,0.
To znamená, že hodnoty by měly být koncentrovány kolem 5,0 a zřídka dále než 1,0 od průměru.
A jak můžete vidět z histogramu, většina hodnot je mezi 4,0 a 6,0, s vrcholem přibližně 5,0.