Data Science - Úvod do statistiky
Úvod do statistiky
Statistika je věda o analýze dat.
Když jsme vytvořili model pro predikci, musíme posoudit spolehlivost predikce.
Koneckonců, jakou cenu má předpověď, když se na ni nemůžeme spolehnout?
Deskriptivní statistika
Nejprve probereme některé základní popisné statistiky.
Popisná statistika shrnuje důležité vlastnosti souboru dat, jako jsou:
- Počet
- Součet
- Standardní odchylka
- Percentil
- Průměrný
- Atd..
Je to dobrý výchozí bod pro seznámení se s daty.
describe()
K sumarizaci dat můžeme použít funkci v Pythonu:
Příklad
print (full_health_data.describe())
Výstup:
Vidíte zde něco zajímavého?