Überblick Lektion 1
Boxplot:
Beispiel mit RÜben
Für den Boxplot ist es sinnvoll, eine etwas größere Datenmenge zu verwenden. Wir benutzen einen Zufallsgenerator, um eine Datenreihe mit 1000 Werten zu erzeugen:
x <- round(10*rnorm(1000))+50
Mit einem Histogramm kann man sich die Verteilung der Werte ganz gut veranschaulichen:
hist(x)

Quartile und Boxplot anzeigen: ℹ️ Hinweis
quantile(x)
boxplot(x, horizontal=T)
Wir machen den Boxplot horizontal, damit wir ihn leichter mit dem Histogramm und den Quartilen vergleichen können.
0% 25% 50% 75% 100%
19 43 50 57 80

Der Streubereich ist der Bereich vom kleinsten bis zum größten Wert:
range(x)
[1] 19 80
Die Spannweite ist die Differenz davon:
diff( range(x) )
[1] 61
Der Interquartilsbereich ist der Bereich von Q1 bis Q3:
Q1 <- quantile(x, 0.25)
Q3 <- quantile(x, 0.75)
c(Q1, Q3)
25% 75%
43 57
Im Boxplot ist das genau der Bereich der Box.
Der Interquartilsabstand ist die Differenz davon:
IQR(x)
[1] 14
Hi 🙂 der Streubereich und die Spannweite ist quasi doch das Gleiche, oder? Also die Spannweite (61) füllt den Streubereich (der von 19 bis 81 geht) genau aus, oder?
Im Prinzip ja. Den Streubereich gibt man normalerweise bei ordinalen Daten an, wo man keine Differenz/Spannweite berechnen kann. Schau mal hier:
https://psycho-hagen.statstutor.de/statstutor/m2-statistik/lektionen/woche-5-6/streubereich-und-interquartilsbereich/
Was ist der Vorteil des ggplot? Wann benutze ich die Alternative genau? 🙂
Es ist ein spezialisiertes Grafikpaket, das deutlich mehr Möglichkeiten hat als das R Basispaket, wenn es z.B. um die Darstellung von sehr ausgefeilten Diagrammen geht.
Ich finde es für einen Statistik Grundkurs eigentlich überflüssig und deplatziert. Aber in den Moodle-Tutorials des M2 Moduls wird es für Grafiken (leider) ausschließlich genutzt…