Funkce Data Science


Tato kapitola ukazuje tři běžně používané funkce při práci s Data Science: max(), min() a mean().


Soubor dat sportovních hodinek

Doba trvání Průměrný_puls Max_Pulse Calorie_Burnage Hodiny_Práce Hodiny_Spánek
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Výše uvedený soubor dat se skládá ze 6 proměnných, z nichž každá má 10 pozorování:

  • Trvání – Jak dlouho trval trénink v minutách?
  • Average_Pulse - Jaký byl průměrný tep tréninku? To se měří tepy za minutu
  • Max_Pulse - Jaký byl maximální puls tréninku?
  • Calorie_Burnage – Kolik kalorií bylo spáleno během tréninku?
  • Hours_Work - Kolik hodin jsme pracovali v naší práci před školením?
  • Hours_Sleep - Kolik jsme spali v noci před tréninkem?

K oddělení řetězců používáme podtržítko (_), protože Python neumí číst mezeru jako oddělovač.



Funkce max().

Funkce Python max()se používá k nalezení nejvyšší hodnoty v poli.

Příklad

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

Funkce min().

Funkce Python min()se používá k nalezení nejnižší hodnoty v poli.

Příklad

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

Funkce mean().

Funkce NumPy mean()se používá k nalezení průměrné hodnoty pole.

Příklad

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

Píšeme np. před mean , aby Python věděl, že chceme aktivovat střední funkci z knihovny Numpy .