Pandy - Spiknutí



Kreslení

Pandas používá plot()metodu k vytváření diagramů.

K vizualizaci diagramu na obrazovce můžeme použít Pyplot, submodul knihovny Matplotlib.

Přečtěte si více o Matplotlib v našem Matplotlib Tutorial .

Příklad

Importujte pyplot z Matplotlib a vizualizujte náš DataFrame:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

Příklady na této stránce používají soubor CSV s názvem: 'data.csv'.

Stáhněte si data.csv nebo otevřete data.csv


Bodový diagram

Určete, že chcete bodový graf s kindargumentem:

kind = 'scatter'

Bodový graf potřebuje osu x a y.

V níže uvedeném příkladu použijeme "Duration" pro osu x a "Calories" pro osu y.

Zahrňte argumenty x a y takto:

x = 'Duration', y = 'Calories'

Příklad

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

Výsledek

Pamatujte: V předchozím příkladu jsme se dozvěděli, že korelace mezi „Duration“ a „Calories“ byla 0.922721, a došli jsme k závěru, že delší doba trvání znamená více spálených kalorií.

Při pohledu na bodový graf budu souhlasit.

Vytvořme další bodový graf, kde existuje špatný vztah mezi sloupci, jako je „Duration“ a „Maxpulse“, s korelací 0.009403:

Příklad

Bodový graf, kde mezi sloupci není žádný vztah:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

Výsledek


w3schools CERTIFIED . 2021

Získejte certifikaci!

Dokončete moduly Pandas, proveďte cvičení, udělejte zkoušku a získáte certifikaci w3schools!

10 $ PŘIHLÁSIT SE

Histogram

Použijte kindargument k určení, že chcete histogram:

kind = 'hist'

Histogram potřebuje pouze jeden sloupec.

Histogram nám ukazuje frekvenci každého intervalu, např. kolik tréninků trvalo mezi 50 a 60 minutami?

V níže uvedeném příkladu použijeme k vytvoření histogramu sloupec "Trvání":

Příklad

df["Duration"].plot(kind = 'hist')

Výsledek

Poznámka: Histogram nám říká, že bylo více než 100 tréninků, které trvaly mezi 50 a 60 minutami.


Otestujte se pomocí cvičení

Cvičení:

Vložte správnou syntaxi pro vizualizaci dat v DataFrame jako diagram (vykreslení).

df.()