Lösungen 03 / 2022 – Teil 3

ℹ️ Hinweis  ← (hier klicken)

Aufgabe 18

Beispiel zur Veranschaulichung:

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Lösungen:

  • 💡  A ist richtig:  Die Alternativhypothese besagt: Mü ist ungleich 5.
  • 💡  B ist richtig:  In der Aufgabe ist p-value = 0,001963. Das ist kleiner als 0,05, also signifikant.
  • 💡  C ist falsch:  Der p-Wert ist nicht die WSK für die H0, sondern die WSK für die Daten, wenn die H0 zutrifft.
  • 💡  D ist falsch:  df = n-1
  • 💡  E ist falsch:  "One Sample t-test"
Aufgabe 19

Es geht um die Bayes-Statistik.

Lösungen:

  • 💡  A ist richtig:  Likelihood ist die WSK für ein beobachtetes Ergebnis, wenn eine Hypothese zutrifft. Siehe Sedlmeier S.690.
  • 💡  B ist falsch:  Das Gegenteil ist richtig. Es ist ein Nachteil der Bayes-Statistik, dass die Häufigkeit von Fehleinschätzungen eben nicht quantifiziert wird. Siehe Sedlmeier S.708.
  • 💡  C ist richtig:  Das entspricht praktisch dem Wortlaut der ℹ️ Vorlesung.
  • 💡  D ist richtig:  Ähnliche Formulierungen findet man in der ℹ️ Pflichtlektüre.
  • 💡  E ist richtig:  Zur Bestimmung der Posteriorverteilung benötigt man das Bayes-Theorem. Siehe Sedlmeier S.692.
Aufgabe 20

Bei dieser Aufgabe geht es um den Zusammenhang von zwei nominalen Merkmalen: der Religionszugehörigkeit und dem Vorliegen einer Depression (als ja oder nein).

Lösungen:

  • 💡  A ist falsch:  Der Phi-Koeffizient ist nur für den Zusammenhang von zwei ℹ️ dichotomen Merkmalen geeignet. Aber in der Aufgabe hat das Merkmal Religionszugehörigkeit vier verschiedene Ausprägungen. ℹ️ Hier ist ein Beispiel wie in der Aufgabe beschrieben. ℹ️ Anderes Beispiel mit zwei dichotomen Merkmalen.
  • 💡  B ist falsch:  Für einen Zusammenhang von zwei Variablen braucht man den ℹ️ Chi-Quadrat-Test für ZWEI Variablen. Es geht hier ja um die beiden Merkmale Religionszugehörigkeit und Vorliegen einer Depression. Beim ℹ️ Chi-Quadrat-Test für EINE Variable geht es um etwas anderes. Siehe auch Lektion 9 - Chi-Quadrat Tests.
  • 💡  C ist falsch:  Vierfeldertafel ist ein anderes Wort für eine 2x2-Häufigkeitstabelle. Eine solche Tabelle ergibt sich nur bei ℹ️ zwei dichotomen Merkmalen.
  • 💡  D ist falsch:  Bei der Varianzanalyse werden die Mittelwerte von mehreren Gruppen verglichen. Mittelwerte kann man aber nur für metrische Merkmale ausrechnen. Das heißt, dass die abhängige Variable bei der Varianzanalyse immer metrisch sein muss. Hier haben wir nur zwei nominale Variablen. ℹ️ Beispiel Varianzanalyse.
  • 💡  E ist falsch:  Für Kendalls Tau müssen beide Merkmale mindestens ordinal-skaliert sein. Hier haben wir zwei nominale Merkmale. Siehe Lektion 3 - Ordinale Zusammenhangsmaße.
Aufgabe 21

Hier ist ein Beispiel, um die Aufgabe zu veranschaulichen:

Beispiel mit ROnline

Punktezahlen für die drei Gruppen:

allein     <- c(60, 68, 72, 74)
lerngruppe <- c(65, 73, 77, 81)
tutorium   <- c(70, 78, 82, 84)
punkte <- c(allein, lerngruppe, tutorium)

Gruppierungsvariable:

gruppe <- c(rep("allein",4), rep("gruppe",4), rep("tutor",4))

Data Frame anzeigen:

strategien <- data.frame(gruppe, punkte)
strategien
   gruppe punkte
1  allein     60
2  allein     68
3  allein     72
4  allein     74
5  gruppe     65
6  gruppe     73
7  gruppe     77
8  gruppe     81
9   tutor     70
10  tutor     78
11  tutor     82
12  tutor     84
Hinweis

Das Fenster mit dem  grünen Button  ist eine R Konsole. Es verhält sich im Prinzip genauso, wie die R Konsole in deinem RStudio. Du kannst damit "rumspielen", die Zahlen verändern und Dinge ausprobieren.

Du kannst nichts kaputt machen! Den Ausgangszustand kannst du jederzeit durch einen Seiten Reload wiederherstellen.


Lösungen:

  • 💡  A ist richtig:  Um die drei Gruppen zu vergleichen, kann man eine ℹ️ Varianzanalyse machen.
  • 💡  B ist falsch:  Der t-Test ist nur für den Vergleich von zwei Gruppen geeignet, nicht jedoch für den (gleichzeitigen) Vergleich von mehr als zwei Gruppen. Natürlich könnte man auch mehrere Gruppen ℹ️ mit mehreren Tests vergleichen, aber hier steht ja: es "kann ein t-Test gerechnet werden". Daher ist diese Aussage wohl als falsch zu bewerten.
  • 💡  C ist falsch:  Es sind nur zwei Variablen für die Gruppenzugehörigkeit und die Prozentpunkte. Siehe oben.
  • 💡  D ist falsch:  Der U-Test ist die Alternative für den t-Test für zwei unabhängige Stichproben. Als Alternative für die Varianzanalyse für mehr als zwei Stichproben ist der Kruskal-Wallis-Test die richtige Alternative. Siehe Zusammenfassung non-parametrische Tests.
  • 💡  E ist richtig:  Man kann für jedes Merkmal eine Häufigkeitstabelle erstellen, natürlich auch für das Merkmal der ℹ️ Gruppenzugehörigkeit.
Aufgabe 22

Hier ist ein Beispiel, um die Aufgabe zu veranschaulichen:

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Lösungen:

  • 💡  A ist richtig:  "...beide der Meinung, dass die von ihnen präferierte Schulform weniger Stress bedeutet". D.h. wenn die Studie neutral sein soll, darf sie sich sozusagen nicht schon vorher für eine der beiden Seiten entscheiden.
  • 💡  B ist richtig:  ℹ️ Beispiel.
  • 💡  C ist richtig:  ℹ️ Beispiel.
  • 💡  D ist richtig:  ℹ️ Beispiel. Zum Vergleich ℹ️ hier auch nochmal Post-hoc.
  • 💡  E ist falsch:  Beim Chi-Quadrat-Test für eine Variable (nicht "für eine Stichprobe") geht es darum, eine bestimmte Verteilung für diese (zumeist nominale) Variable zu überprüfen. Beim Chi-Quadrat-Test für zwei Variablen geht es um den Zusammenhang von zwei (zumeist nominalen) Variablen.
Aufgabe 23

Hier ist ein Beispiel, um die Aufgabe zu veranschaulichen:

Beispiel mit ROnline

Data Frame mit einkommen und grosszuegigkeit:

einkommen       <- c(20, 30, 40, 50, 60)
grosszuegigkeit <- c(2, 4, 3, 6, 5)
data.frame(einkommen, grosszuegigkeit)
  einkommen grosszuegigkeit
1        20               2
2        30               4
3        40               3
4        50               6
5        60               5
Hinweis

Das Fenster mit dem  grünen Button  ist eine R Konsole. Es verhält sich im Prinzip genauso, wie die R Konsole in deinem RStudio. Du kannst damit "rumspielen", die Zahlen verändern und Dinge ausprobieren.

Du kannst nichts kaputt machen! Den Ausgangszustand kannst du jederzeit durch einen Seiten Reload wiederherstellen.


In der Aufgabe steht: "Gehen Sie davon aus, dass die Bedingungen für parametrisches Testen erfüllt sind". Auch wenn es nicht explizit dabei steht, so ist in diesem Fall sicher damit gemeint, dass beide Variablen metrisch-skaliert sind. Man kann also eine Korrelation und auch eine Regression berechnen.

Lösungen:

  • 💡  A ist falsch:  Das würde nur dann einen Sinn ergeben, wenn eines der beiden Merkmale, z.B. das Einkommen, mit nur wenigen verschiedenen Ausprägungen erfasst würde. ℹ️ Beispiel
  • 💡  B ist richtig:  Wenn die beiden Variablen tatsächlich metrisch-skaliert sind (z.B. so wie oben dargestellt), dann kann man den Zusammenhang gut in einem ℹ️ Scatterplot/Streudiagramm darstellen.
  • 💡  C ist richtig:  Wenn die beiden Variablen tatsächlich metrisch-skaliert sind (z.B. so wie oben dargestellt), dann kann man natürlich auch eine Korrelation ausrechnen. Also kann man auch einen ℹ️ t-Test für Korrelationen rechnen. Und bei jedem t-Test ist die (standardisierte) Prüfgröße immer der t-Wert.
  • 💡  D ist richtig:  Man kann auch eine Regression berechnen und (z.B.) ℹ️ die Regressionsgerade im Streudiagramm anzeigen.
  • 💡  E ist falsch:  Beides ist möglich. Hier ist ein ℹ️ Beispiel für vergrößern und ein ℹ️ Beispiel für verkleinern. Siehe auch Aufgabe 3C der Klausur 09/2021.
Aufgabe 24

Lösungen:

  • 💡  A ist falsch:  Der t-Test ist ein ℹ️ parametrischer Test.
  • 💡  B ist falsch:  Bei der Poweranalyse geht es immer um die Teststärke von Hypothesentests / Signifikanztests. Und diese gehören zur Inferenzstatistik. Bei jedem Hypothesentest (oder Signifikanztest) versucht man, von einer Stichprobe auf die Population zu schließen.
  • 💡  C ist falsch:  Zum Beispiel sind Chi-Quadrat-Tests insbesondere für nominale Daten geeignet.
  • 💡  D ist richtig:  Non-parametrische Tests sind genau dann eine Alternative zu den parametrische Tests, wenn die Voraussetzungen für parametrisches Testen verletzt sind.
  • 💡  E ist falsch:  Der Kruskal-Wallis-Test ist die non-parametrische Alternative zur (parametrischen) Varianzanalyse. Siehe Zusammenfassung non-parametrische Tests
Aufgabe 25

Bei dieser Aufgabe soll eine Zahl aus einer Tabelle abgelesen werden.

☝️ Tipp: Bei dieser Art von Aufgaben ist es sinnvoll, immer zuerst die eigentliche Frage unter der Tabelle zu lesen.

Lösung: 26,32

Aufgabe 26

Hier geht es darum, einfach nur den Aufgabentext zu lesen, um die entsprechende Information zu finden.

☝️ Tipp: Bei dieser Art von Aufgaben ist es sinnvoll, immer zuerst die eigentliche Frage am Ende des Textes zu lesen, damit man weiß, worauf man beim Lesen des Textes achten soll.

Lösung: 11,5

3 Gedanken zu „Lösungen 03 / 2022 – Teil 3“

  1. Hallo Guido,

    Ich habe die Antwort zur Frage 23, E nicht verstanden. Die Korrelation ist ja mit Ausreißer 0.08 und ohne Ausreißer, 1. Dann ist die Antwort dass es sich ohne Ausreißer vergrößert doch richtig. Oder habe ich es falsch verstanden?

    Vishakha

    1. Ja, aber die Aussage ist insgesamt falsch, weil da steht: der Zusammenhang kann sich nicht verkleinern. Verkleinern ist aber genauso möglich wie Vergrößern. Für beides findest du oben jeweils ein Beispiel.

      1. Ach ja, ich habe die Aussage nicht richtig verstanden. Das stimmt. Beides ist möglich, nicht nur vergrößern. Danke

Schreibe einen Kommentar