Data Science - Úvod do statistiky


Úvod do statistiky

Statistika je věda o analýze dat.

Když jsme vytvořili model pro predikci, musíme posoudit spolehlivost predikce.

Koneckonců, jakou cenu má předpověď, když se na ni nemůžeme spolehnout?


Deskriptivní statistika

Nejprve probereme některé základní popisné statistiky.

Popisná statistika shrnuje důležité vlastnosti souboru dat, jako jsou:

  • Počet
  • Součet
  • Standardní odchylka
  • Percentil
  • Průměrný
  • Atd..

Je to dobrý výchozí bod pro seznámení se s daty.

describe()K sumarizaci dat můžeme použít funkci v Pythonu:

Příklad

print (full_health_data.describe())

Výstup:

Stat Popis

Vidíte zde něco zajímavého?