Funkce Data Science
Tato kapitola ukazuje tři běžně používané funkce při práci s Data Science: max(), min() a mean().
Soubor dat sportovních hodinek
Doba trvání | Průměrný_puls | Max_Pulse | Calorie_Burnage | Hodiny_Práce | Hodiny_Spánek |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Výše uvedený soubor dat se skládá ze 6 proměnných, z nichž každá má 10 pozorování:
- Trvání – Jak dlouho trval trénink v minutách?
- Average_Pulse - Jaký byl průměrný tep tréninku? To se měří tepy za minutu
- Max_Pulse - Jaký byl maximální puls tréninku?
- Calorie_Burnage – Kolik kalorií bylo spáleno během tréninku?
- Hours_Work - Kolik hodin jsme pracovali v naší práci před školením?
- Hours_Sleep - Kolik jsme spali v noci před tréninkem?
K oddělení řetězců používáme podtržítko (_), protože Python neumí číst mezeru jako oddělovač.
Funkce max().
Funkce Python max()
se používá k nalezení nejvyšší hodnoty v poli.
Příklad
Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_max)
Funkce min().
Funkce Python min()
se používá k nalezení nejnižší hodnoty v poli.
Příklad
Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_min)
Funkce mean().
Funkce NumPy mean()
se používá k nalezení průměrné hodnoty pole.
Příklad
import numpy as np
Calorie_burnage =
[240, 250, 260, 270, 280, 290, 300, 310, 320, 330]
Average_calorie_burnage =
np.mean(Calorie_burnage)
print(Average_calorie_burnage)
Píšeme np. před mean , aby Python věděl, že chceme aktivovat střední funkci z knihovny Numpy .