Data Science - Statistika Percentily


25 %, 50 % a 75 % – percentily

Percentily se ve statistikách používají k tomu, abyste získali číslo, které popisuje hodnotu, o kterou je dané procento hodnot nižší.

Percentily

Pokusme se to vysvětlit na několika příkladech pomocí Average_Pulse.

  • 25% percentil Average_Pulse znamená, že 25% všech tréninků má průměrný tep 100 tepů za minutu nebo nižší. Pokud toto tvrzení otočíme, znamená to, že 75 % všech tréninků má průměrný tep 100 tepů za minutu nebo vyšší.
  • 75% percentil Average_Pulse znamená, že 75% všech tréninkových jednotek má průměrný pulz 111 nebo nižší. Pokud toto tvrzení otočíme, znamená to, že 25 % všech tréninků má průměrný tep 111 tepů za minutu nebo vyšší.

Úkol: Najděte 10% percentil pro Max_Pulse

Následující příklad ukazuje, jak to udělat v Pythonu:

Příklad

import numpy as np

Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
  • Max_Pulse = full_health_data["Max_Pulse"] – Izolujte proměnnou Max_Pulse z úplné sady údajů o zdraví.
  • np.percentile() se používá k definování, že chceme 10% percentil z Max_Pulse.

10% percentil Max_Pulse je 120. To znamená, že 10% všech tréninků má Max_Pulse 120 nebo nižší.