Pandy - Spiknutí
Kreslení
Pandas používá plot()
metodu k vytváření diagramů.
K vizualizaci diagramu na obrazovce můžeme použít Pyplot, submodul knihovny Matplotlib.
Přečtěte si více o Matplotlib v našem Matplotlib Tutorial .
Příklad
Importujte pyplot z Matplotlib a vizualizujte náš DataFrame:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
Příklady na této stránce používají soubor CSV s názvem: 'data.csv'.
Stáhněte si data.csv nebo otevřete data.csv
Bodový diagram
Určete, že chcete bodový graf s
kind
argumentem:
kind = 'scatter'
Bodový graf potřebuje osu x a y.
V níže uvedeném příkladu použijeme "Duration" pro osu x a "Calories" pro osu y.
Zahrňte argumenty x a y takto:
x = 'Duration', y = 'Calories'
Příklad
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
Výsledek
Pamatujte:
V předchozím příkladu jsme se dozvěděli, že korelace mezi „Duration“ a „Calories“ byla 0.922721
, a došli jsme k závěru, že delší doba trvání znamená více spálených kalorií.
Při pohledu na bodový graf budu souhlasit.
Vytvořme další bodový graf, kde existuje špatný vztah mezi sloupci, jako je „Duration“ a „Maxpulse“, s korelací 0.009403
:
Příklad
Bodový graf, kde mezi sloupci není žádný vztah:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
Výsledek
Získejte certifikaci!
10 $ PŘIHLÁSIT SE
Histogram
Použijte
kind
argument k určení, že chcete histogram:
kind = 'hist'
Histogram potřebuje pouze jeden sloupec.
Histogram nám ukazuje frekvenci každého intervalu, např. kolik tréninků trvalo mezi 50 a 60 minutami?
V níže uvedeném příkladu použijeme k vytvoření histogramu sloupec "Trvání":
Příklad
df["Duration"].plot(kind = 'hist')
Výsledek
Poznámka: Histogram nám říká, že bylo více než 100 tréninků, které trvaly mezi 50 a 60 minutami.