Lösungen 09 / 2021 – Teil 3

Aufgabe 17

Lösungen:

  • 💡  A ist richtig:  one-way analysis of variance ist die einfaktorielle ANOVA. k=4 heißt, dass es um 4 Gruppen geht.
  • 💡  B ist richtig:  Das n im Output ist das Ergebnis der Power-Analyse. Das n muss immer aufgerundet werden, da man ja immer eine ganze Anzahl von Versuchspersonen braucht.
  • 💡  C ist richtig:  sig.level = 0.05
  • 💡  D ist falsch:  f ist hier die ℹ️ Effektgröße. Je größer der angenommene Effekt, desto größer die Power. Gleiches gilt für die Stichprobengröße: Je größer die Stichprobe, desto größer die Power. Also können wir bei einem größeren Effekt, die Stichprobengröße reduzieren, um die gewünschte Power = 0.9 zu erreichen. Probier es oben einfach mal aus.
  • 💡  E ist richtig:  Die Power ist 1-β = 0.9. Also ist β = 0.1
Aufgabe 18

Lösungen:

  • 💡  A ist falsch:  Die Daten entstehen ℹ️ immer durch Zufall. Der p-Wert ist die WSK für die Daten unter der Bedingung, dass die H0 richtig ist. p = P(Daten|H0). ℹ️ Tipp.
  • 💡  B ist richtig:  Wenn z.B. p = 0,4 ist, dann ist es viel besser, wenn man sagt, wie der p-Wert tatsächlich ist, als einfach nur zu sagen: "p > 0,05" oder "der Test war nicht signifikant".
  • 💡  C ist richtig 
  • 💡  D ist falsch:  Siehe Moodle Lerneinheit "NHST-Beispiele 1: t-Tests – Tutorial: t-Tests". Diese sogenannte "Obergrenze des Bayes-Faktors" berechnet man anhand des p-Wertes. Die Formel steht im oben genannten Tutorial im Moodle. Sie lautet: 1/(-exp(1)*p*log(p)). Diese Formel muss man nicht auswendig kennen. Aber man sieht sofort, dass für die Berechnung keine Rohdaten notwendig sind. Man braucht nur den p-Wert.
  • 💡  E ist richtig:  Bei soviel Wischi-Waschi (mit latenten Variablen, etc.) sollte man immer bescheiden mit seinen Ergebnissen umgehen.
Aufgabe 19

Lösungen:

  • 💡  A ist falsch:  Für einen t-Test benötigt man immer eine metrische abhängige Variable, für die man einen Mittelwert berechnen kann. Hier haben wir nur zwei nominale (dichotome) Merkmale.
  • 💡  B ist richtig:  ℹ️ Siehe hier.
  • 💡  C ist falsch:  Der Phi-Koeffizient lässt sich nur für 2×2-Tabellen (Vierfeldertafeln) berechnen. Also nur für zwei dichotome Merkmale. Wenn das Geschlecht eine dritte Ausprägung hat, dann haben wir eine 3×2-Tabelle. ℹ️ Siehe hier.
  • 💡  D ist falsch:  Das könnte man zwar machen (s.o.), aber der Lehrstuhl legt Wert darauf, dass solche Variablen immer als Faktoren abgelegt werden, auch wenn das im Ergebnis oft ℹ️ keinen wesentlichen Unterschied macht.
  • 💡  E ist falsch:  Es gilt als eine Voraussetzung für den Chi-Quadrat-Test, dass "jede Person eindeutig einer bestimmten Merkmalsausprägung bzw. Merkmalskombination zugeordnet werden kann" (siehe Sedlmeier S.568). ℹ️ Das ist ja irgendwie klar.
Aufgabe 20

Anders formuliert lautet die Frage: Welche Fehler kann es bei der Arbeit mit R geben?

Lösungen:

  • 💡  A ist richtig:  ℹ️ Beispiel.
  • 💡  B ist richtig:  ℹ️ Beispiel.
  • 💡  C ist richtig:  ℹ️ Beispiel.
  • 💡  D ist falsch:  Hinter einem Befehl muss kein Punkt gesetzt werden.
  • 💡  E ist richtig:  ℹ️ Beispiel.
Aufgabe 21

Bei dieser Aufgabe geht es um die F-Verteilung, wie sie auch bei der ANOVA zum Einsatz kommt:

Schematische Darstellung

Lösungen:

  • 💡  A ist falsch:  2.40 ist links von 2.53, also im Annahmebereich.
  • 💡  B ist richtig:  In der Aufgabe steht: "Die äußersten 5 % der Fläche unter der Kurve sind rot eingefärbt".
  • 💡  C ist richtig:  Siehe das Schaubild oben.
  • 💡  D ist falsch  Varianzanalyse ja, aber in der Aufgabe steht "4 Zählerfreiheitsgrade" und das heißt fünf Gruppen. Denn es gilt: dfzw = k-1
  • 💡  E ist falsch:  Es gibt keine negativen Freiheitsgrade. Und es gibt auch keinen negativen Bereich der F-Verteilung. In der F-Verteilung gibt es nur positive Werte.
Aufgabe 22

Hier ist ein ähnliches Beispiel zur Veranschaulichung:

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.
Diese Inhalte werden erst nach Zahlungseingang freigeschaltet.

Lösungen:

  • 💡  A ist falsch:  "Er stellt die Hypothese auf, dass Personen, die vor Mitternacht schlafen gehen, sich am nächsten Tag wacher fühlen als…". Außerdem steht auch im Output, was die Alternativhypothese ist: "true difference in mean is less than 0".
  • 💡  B ist falsch:  Der Datensatz heißt mitternacht. Denn im Output steht: "data: mitternacht$wachheit by mitternacht$zeitpunkt".
  • 💡  C ist falsch: 
  • 💡  D ist falsch:  "Variable wachheit, gemessen auf einer […] Skala, die von 0 bis 10 reicht, wobei höhere Werte einer höheren Wachheit entsprechen".
  • 💡  E ist falsch:  Der t-Wert ist nicht der "pure" Mittelwertunterschied, sondern der Mittelwertunterschied geteilt durch den Standardfehler. Der t-Wert ist der standardisierte Mittelwertunterschied. Der eigentliche Mittelwertunterschied ist 5,249714 minus 6,147838 gleich -0,898124.
Aufgabe 23

Lösungen:

  • 💡  A ist falsch:  Der geeignete t-Test wäre der ℹ️ für abhängige Stichproben.
  • 💡  B ist falsch:  Ein ℹ️ Randomisierungstest ist als Alternative zum t-Test geeignet, wenn die Normalverteilungsannahme verletzt ist, also wenn die Verteilung in der Population keine NV ist. Aber der Randomisierungstest ist keine Alternative zum t-Test, wenn die Daten nicht metrisch sind. Für ordinale oder nominale Daten kann ich keinen t-Test machen, auch keinen Randomisierungstest. Egal ob "normaler" t-Test oder Randominiserungstest, die Daten müssen metrisch sein, also mindestens intervall-skaliert.
  • 💡  C ist falsch:  Korrelation ist nicht Kausalität!! Über die Ursache ist nichts bekannt!
    ☝️ Merke: Wann immer in einer Aussage von einer Ursache (einem Grund) oder einem Kausalzusammenhang die Rede ist, ist die Aussage vermutlich als falsch zu bewerten. Auch wenn ein solcher Kausalzusammenhang hier naheliegt und sich geradezu aufdrängt, so sind dennoch nur anhand der Daten keine solche Aussagen über die Kausalitäten zulässig.
  • 💡  D ist falsch:  Post-hoc wird nicht vorher gemacht, sondern nachher, wenn ich wissen will, wie die Power war. A-priori wird vorher gemacht, wenn ich wissen will, wie groß meine Stichprobe für eine bestimmte Power sein muss. ℹ️ Beispiel.
  • 💡  E ist falsch:  Cohens d gibt es nicht nur als Abstandsmaß/Effektgröße bei unabhängigen Stichproben, sondern ℹ️ auch bei abhängigen Stichproben.
Aufgabe 24

Lösungen:

  • 💡  A ist richtig:  Diese Aussage ist identisch zu Aussage 6D aus der Klausur 03/2021. Eine Stichprobenverteilung ist immer die ℹ️ WSK-Verteilung für den Kennwert einer Stichprobe.
  • 💡  B ist richtig:  Eigentlich ist der Chi-Quadrat-Test für eine Variable gemeint, nicht für eine Stichprobe. Es gibt einen ℹ️ Chi-Quadrat-Test für eine Variable und einen für zwei Variablen. Beim Chi-Quadrat-Test für eine Variable, geht es immer darum, die Häufigkeitsverteilung dieser Variable mit einer bestimmten (von der H0) vorgegebenen Verteilung zu vergleichen.
  • 💡  C ist falsch:  Chi-Quadrat-Tests sind auch für nominale Daten geeignet. Bei Chi-Quadrat (X2) handelt es sich u.a. um ein Zusammenhangsmaß für nominale Daten.
  • 💡  D ist falsch:  η2 (Eta Quadrat) ist ein Effektgrößenmaß für die ANOVA. Das Effektgrößenmaß für den Chi-Quadrat-Test heißt ω (omega).
  • 💡  E ist falsch:  Das Effektgrößenmaß für den Chi-Quadrat-Test heißt ω (omega), und zwar sowohl für den Chi-Quadrat-Test für eine Variable als auch für den für zwei Variablen. Siehe Sedlmeier Seite 553 und Seite 565 (ω wird dort einfach nur als w geschrieben).
Aufgabe 25

Bei dieser Aufgabe geht es darum, den Aufgabentext zu lesen, um die entsprechenden Informationen zu finden.

☝️ Tipp: Bei dieser Art von Aufgaben ist es sinnvoll, immer zuerst die eigentliche Frage am Ende des Textes zu lesen, damit man weiß, worauf man sich beim Lesen des Textes konzentrieren soll.

Alle benötigten Informationen stehen im Text, man muss nur lesen.

"Das n im Zähler steht dabei für die Anzahl der Wertepaare".

"Die Freiheitsgrade für diesen Test betragen df = n-2".

"Nach einigen Monaten hat er Daten von 25 Paaren vorliegen".

Wie viele Freiheitsgrade hat der entsprechende Signifikanztest?

Lösung: df = n-2 = 25-2 = 23

Aufgabe 26

Bei dieser Aufgabe soll wieder eine Zahl aus einer Tabelle abgelesen werden.

☝️ Tipp: Bei dieser Art von Aufgaben ist es sinnvoll, immer zuerst die eigentliche Frage unter der Tabelle zu lesen.

In den Spaltenüberschriften steht, wie viele Eltern mit Early-Onset-Depression (16) und wie viele mit Late-Onset-Depression (27) insgesamt untersucht wurden (bzw. deren Kinder).

Innerhalb der mittleren Spalte wurden die 16 Early-Onset-Depressiven Eltern dann nochmal nach bestimmten Merkmalen (ℹ️ jeweils in Prozent) aufgeschlüsselt. Zum Beispiel waren 6,3% männlich und 93,7% weiblich. Oder 68,8% waren verheiratet und 31,2% single. Dabei ergeben die verschiedenen Ausprägungen eines Merkmals zusammen immer 100 Prozent.

Um die Lesenden zusätzlich noch ein bisschen zu verwirren, wurde zwischendrin einfach mal das Durchschnittsalter ("Age mean ") eingestreut….

Lösung: 68,8

Schreibe einen Kommentar