R Scatter Plot


Rozptylové pozemky

Z kapitoly Vykreslování jste se dozvěděli , že plot()funkce se používá k vykreslování čísel proti sobě.

"Rozptylový graf" je typ grafu používaný k zobrazení vztahu mezi dvěma numerickými proměnnými a vykresluje jednu tečku pro každé pozorování.

Potřebuje dva vektory stejné délky, jeden pro osu x (horizontální) a jeden pro osu y (vertikální):

Příklad

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

Výsledek:

Pozorování ve výše uvedeném příkladu by mělo ukázat výsledek 12 projíždějících aut.

To nemusí být jasné pro někoho, kdo vidí graf poprvé, takže přidejte záhlaví a různé štítky, které lépe popíší bodový graf:

Příklad

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")

Výsledek:

Abychom to shrnuli, pozorování v příkladu výše je výsledkem 12 projíždějících aut.

Osa x ukazuje, jak staré auto je.

Osa y ukazuje rychlost auta, když projíždí.

Existují mezi pozorováními nějaké vztahy?

Zdá se, že čím novější auto, tím rychleji jede, ale to může být náhoda, vždyť jsme registrovali jen 12 aut.


Porovnejte pozemky

Ve výše uvedeném příkladu se zdá, že existuje vztah mezi rychlostí auta a stářím, ale co když vykreslíme pozorování také z jiného dne? Řekne nám rozptylová zápletka něco jiného?

Chcete-li porovnat graf s jiným grafem, použijte points()funkci:

Příklad

Nakreslete dva výkresy na stejný obrázek:

# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

Výsledek:

Poznámka: Abyste mohli vidět rozdíl v porovnání, musíte grafům přiřadit různé barvy (pomocí colparametru). Červená představuje hodnoty dne 1, zatímco modrá představuje den 2. Všimněte si, že jsme také přidali cexparametr pro zvětšení velikosti bodů.

Závěr pozorování: Srovnáním dvou grafů si myslím, že lze s jistotou říci, že oba nám dávají stejný závěr: čím novější auto, tím rychleji jede.