Lösungen 09 / 2021 – Teil 2

Aufgabe 9

Lösungen:

  • 💡  A ist falsch:  Du kannst nie eine mathematische WSK für eine Hypothese berechnen. Beim Hypothesentesten berechnet man immer nur den p-Wert. Und der p-Wert ist die WSK für die Daten in der Stichprobe unter der Bedingung, dass die Nullhypothese richtig ist. Beim Bootstrapping geht es darum, mit Hilfe von Resampling-Methoden ein Konfidenzintervall zu ermitteln. Das Resampling ist lediglich eine Methode, um die Stichprobenverteilung zu ermitteln. Auch ein Konfidenzintervall erlaubt keine WSK-Aussage über den wahren Mittelwert µ der Population, also auch keine WSK-Aussage über die Richtigkeit der Nullhypothese. Siehe Lektion 6 – Konfidenzintervalle.
  • 💡  B ist falsch:  Beim Resampling gibt es beides, sowohl Verfahren mit Zurücklegen als auch ohne Zurücklegen. Insbesondere beim Bootstrap werden die Stichproben mit Zurücklegen gezogen.
  • 💡  C ist richtig:  ℹ️ Hinweis zum Auswendiglernen.
  • 💡  D ist richtig  Resampling-Verfahren (von denen das Bootstrap eine Variante ist) sind Methoden, um die Stichprobenverteilung zu ermitteln – also auch dann, wenn keine theoretische abgeleitete Stichprobenverteilung vorliegt.
  • 💡  E ist falsch:  Eine Bootstrapping-Stichprobe ist "eine Stichprobe aus der Stichprobe". Diese "Unterstichprobe" ist normalerweise genauso groß, wie die ursprüngliche Stichprobe (sie ist nicht identisch, weil sie ja "mit Zurücklegen" gezogen wird). Ich weiß nicht, was mit "unterschätzen" gemeint ist, aber je kleiner die Stichprobe, desto ungenauer die Schätzung, also desto breiter die Stichprobenverteilung und desto größer das Konfidenzintervall.
Aufgabe 10

Die Aufgabe ist ähnlich zu Aufgabe 7 aus der Klausur 03/2021.

In dieser Aufgabe geht es darum, wie man bei einem t-Test die Teststärke (Power) verändern kann.

Es gibt eine Tabelle mit den Daten für vier verschiedene ℹ️ t-Tests für unabhängige Stichproben. Für jeden dieser t-Tests wurde ein separates Experiment durchgeführt. Es sind jeweils die folgenden Daten angegeben:

▪️ Die Größen ℹ️ der beiden unabhängigen Stichproben

▪️ Die Effektgröße Cohens d

▪️ Das Signifikanzniveau Alpha (α)

☝️Es sind genau diese drei Größen, die einen Einfluss auf die Teststärke (Power) haben.
☝️ Achtung, das Cohens d in der Tabelle steht nicht für den Unterschied der Gruppen in der Stichprobe, sondern für den in der H1 postulierten Effekt in der Population. Das ist in der Aufgabe ℹ️ fehlerhaft dargestellt.

In der Aufgabe geht es darum, in welcher Weise die Power jeweils beeinflusst wird.

Wir müssen also wissen, wie ist der Zusammenhang zwischen:

1) Cohens d und Power

2) Stichprobengröße und Power

3) Alpha (α) und Power

☝️Für alle drei Angaben gilt: Je größer der jeweilige Wert, desto größer die Power.

1) Je größer Cohens d desto größer die Power:

2) Je größer die Stichprobe desto größer die Power:

Je größer die Stichprobe, desto kleiner der Standardfehler (SE) und desto schmaler die Stichprobenverteilung.

Je größer die Stichprobe, desto genauer die Schätzung.

3) Je größer Alpha (α) desto größer die Power:

Je größer α, desto kleiner β.

Je größer α, desto größer 1-β.

Mit diesem Wissen sind die Aussagen in der Aufgabe leicht zu bewerten. Hier ist nochmal die Tabelle:

Lösungen:

  • 💡  A ist richtig:  In Jahrgang 5 sind die Stichproben größer.
  • 💡  B ist falsch:  In Jahrgang 8 ist Alpha (α) größer.
  • 💡  C ist falsch:  In Jahrgang 5 ist Cohens d größer.
  • 💡  D ist richtig:  Zwei Anmerkungen zu dieser Aussage:
    • Erstens: Wie oben schon erwähnt, ist die Aufgabe insgesamt fehlerhaft. Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.
      Diese Inhalte werden erst nach Zahlungseingang freigeschaltet.
    • Zweitens: Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.
      Diese Inhalte werden erst nach Zahlungseingang freigeschaltet.

      … dann ist diese Aussage dennoch ein bisschen gemein. Denn im ersten Augenblick leuchtet es überhaupt nicht ein, warum man statt Cohens d den Korrelationskoeffizient r berechnen sollte. ℹ️ Wieso ist eine solche Berechnung möglich und sinnvoll? Und: ℹ️ Warum sollte das überhaupt wichtig sein?

  • 💡  E ist richtig:  ℹ️ Power-Berechnung mit R.
Aufgabe 11

Der Aufgabentext reduziert sich auf das folgende Beispiel:

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.
Diese Inhalte werden erst nach Zahlungseingang freigeschaltet.

Lösungen:

  • 💡  A ist richtig:  Das "wide format" ist das ganz normale Anzeigeformat für einen Data Frame, wie oben dargestellt.
  • 💡  B ist falsch:  Richtig wäre music$instrument.
  • 💡  C ist richtig:  ℹ️ Beispiel.
  • 💡  D ist richtig:  ℹ️ Beispiel.
  • 💡  E ist falsch:  Der Phi-Koeffizient ist nur geeignet für 2×2-Kreuztabellen (also nur für zwei dichotome Merkmale). Das Geschlecht hat aber 3 Ausprägungen und die Musikrichtung hat 8 Ausprägungen. Also haben wir eine ℹ️ 3×8-Kreuztabelle.
Aufgabe 12

Bei dieser Aufgabe geht es um die sogenannte Präregistrierung. Das ist im Sedlmeier ab Seite 645 (am Ende des mittleren Abschnitts), sowie im grünen Kasten auf Seite 648, beschrieben.

Bei der Präregistrierung wird das Design einer Studie im Voraus dokumentiert. Das Design ist sozusagen das gesamte "Setup", also z.B. welche Hypothesen ich testen will, welche Stichproben ich dafür nehmen will und vor allem wie groß die jeweiligen Stichproben sein sollen.

Alle diese Entscheidungen werden im Vorfeld dokumentiert, sodass ich mich während der Durchführung der Studie nicht mehr anders entscheiden kann.

Lösungen:

  • 💡  A ist richtig:  HARKing steht für Hypothesizing After Results are Known. Wenn man HARKing praktiziert, stellt man die Hypothese(n) erst dann auf, wenn man die Daten schon kennt, also wenn man praktisch schon weiß, ob das Ergebnis für die dann aufgestellte Hypothese signifikant ist oder nicht (siehe Sedlmeier S.636). Korrekterweise muss man am Anfang des Forschungsprojektes sagen, welche Hypothese man überprüfen will, nicht am Ende. Mit der Präregistrierung beim Open Science Framework wird HARKing verhindert, weil man die zu überprüfende(n) Hypothese(n) vorher bekanntgeben muss.
  • 💡  B ist richtig:  Optional Stopping heißt: Wenn das Testergebnis nicht signifikant ist, vergrößert man einfach seine Stichprobe. Und zwar so lange, bis ein signifikantes Ergebnis herauskommt (siehe Sedlmeier S.639 unten). Mit der Präregistrierung muss man die Stichprobengröße vorher bekanntgeben, also noch bevor man die Stichprobe überhaupt zieht.
  • 💡  C ist falsch  Die Präregistrierung kann nicht verhindern, dass jemand seine Daten fälscht. Bei der Präregistrierung wird das "Setup" im Voraus dokumentiert, also z.B. die zu überprüfende(n) Hypothese(n) und die Stichprobengröße, nicht aber das Ergebnis. Die Daten sind ja gewissermaßen das Ergebnis.
  • 💡  D ist richtig:  Alle Variablen (UVs und AVs) muss man bei der Präregistrierung angeben (siehe Sedlmeier Seite 645 Mitte).
  • 💡  E ist falsch:  Mit der Präregistrierung kann man nicht verhindern, dass jemand seinen p-Wert einfach abrundet. Bei der Präregistrierung wird das "Setup" im Voraus dokumentiert, nicht aber das Ergebnis.
Aufgabe 13

Bei dieser Aufgabe müssen ein paar Information aus dem Text und der dargestellten Tabelle abgelesen werden.

Es geht um den Vergleich der Arbeitsbedingungen von Erzieherinnen aus Italien und Hongkong.

In der Tabelle sind 10 verschiedene Variablen dargestellt, welche jeweils für die Zufriedenheit mit einem bestimmten Aspekt der Arbeit stehen (z.B. die Bezahlung – Pay), sowie die Ergebnisse der t-Tests für den Vergleich von Italien und Hongkong. Also für jede Variable:

  • Mittelwerte für die Erzieherinnen aus Italien und Hongkong (in Klammern jeweils dahinter auch noch die Standardabweichungen)
  • die Differenz dieser beiden Mittelwerte
  • sowie der t-Wert für diese Mittelwertdifferenz

Hier beispielhaft für die Variable Pay:

Die doppelten Sternchen (**) hinter den t-Werten zeigen an, ob diese t-Werte auf einem Alpha-Niveau von 1% signifikant sind oder nicht (siehe Fußnote **p<0.01).

ℹ️ Beispielhafter t-Test für die Variable Pay.

Lösungen:

  • 💡  A ist richtig:  ℹ️ Es sind unabhängige Stichproben.
  • 💡  B ist falsch:  Die Stichprobengrößen stehen direkt über der Tabelle.
  • 💡  C ist richtig:  Der Mittelwert für TJS (laut Fußnote die Total Job Satisfaction) ist für Italien größer.
  • 💡  D ist falsch:  Es gibt einige t-Werte mit zwei Sternchen (**), was laut Fußnote bedeutet, das diese t-Werte auf einem Alpha-Niveau von 1% signifikant sind. Dann sind sie auf einem Alpha-Niveau von 5% erst recht signifikant.
  • 💡  E ist richtig:  Es wurden mindestens die 10 t-Tests aus der Tabelle durchgeführt, also mindestens 10 Hypothesen geprüft.
Aufgabe 14

Bei dieser Aufgabe müssen einige Informationen aus dem englischen Text abgelesen werden.

Lösungen:

  • 💡  A ist falsch:  "As regards sex, women exhibited significantly higher levels of adherence to quarantine guidelines [t(3670) = -11.145, p<0.01, Hedges g = 0.401] compared to the men".
  • 💡  B ist falsch:  Siehe bei Aussage A in den eckigen Klammern.
  • 💡  C ist richtig:  "Significant differences in adherence within the marital status [F(4;3667) = 36.097, p<0.001, ωp2 = 0.036] revealed that singles' adherence mean was statistically significantly lower than…". Als Prüfgröße wurde ein F-Wert angegeben, also wurde ein F-Test / eine ANOVA / ein Overall-Test (=> "Overall-Vergleich") gemacht.
  • 💡  D ist falsch:  "Participants with a high education showed the highest scores of adherences among the other levels of education [F(3;3668) = 10.228, p<0.001, ωp2 = 0.007]".
  • 💡  E ist richtig:  Allein für die Aussagen A, C und D wurden schon drei verschiedene Hypothesen getestet.
Aufgabe 15

In dieser Aufgabe ist eine Tabelle für die Korrelation von 8 verschiedenen Merkmalen/Variablen dargestellt. Für jede Variable wurde die Korrelation mit jeder anderen Variable berechnet.

In der linken Spalte befinden sich die Namen der Merkmale/Variablen. In den Spaltenüberschriften sind nur die Nummern der einzelnen Variablen aufgeführt. Die Korrelation zwischen:

  • "emotion subscale" und "attitude subscale" ist 0.33.
  • "emotion subscale" und "behaviour subscale" ist 0.47.
  • "emotion subscale" und "GQ6" ist 0.71.
  • usw.

Die in der Tabelle dargestellten ℹ️ Sternchen (**) sind für diese Aufgabe irrelevant.

Lösungen:

  • 💡  A ist richtig:  ℹ️ Ähnliches Beispiel. ℹ️ Ergänzung.
  • 💡  B ist richtig:  Die Korrelation einer Variablen mit sich selbst ist immer eins.
  • 💡  C ist richtig:  Die Korrelation ist 0.58. Da die ℹ️ untere Diagonale ausgeblendet ist, muss man die Korrelation behavior subscale und GQ6 in der dritten Zeile der vierten Spalte ablesen.
  • 💡  D ist falsch:  Viele Korrelationen in der Tabelle sind r < 0,3, was laut Cohens Konventionen als mittlerer oder sogar schwacher Zusammenhang zu interpretieren ist. Siehe Sedlmeier, S.223.
  • 💡  E ist richtig:  Die Korrelation zwischen GQ6 und social awareness ist 0.2. Also je größer die "social awareness", desto größer tendenziell (oder im Durchschnitt) die Dankbarkeit…
Aufgabe 16

Bei dieser Aufgabe geht es um die Frage, ob es einen Zusammenhang gibt zwischen der Anzahl der "displayfreien Minuten" vor dem Zubettgehen und der Schlafqualität.

Beim dargestellten Output handelt es sich um einen t-Test für den Regressionskoeffizienten. Der Zusammenhang soll also mithilfe der ℹ️ Regressionsanalyse überprüft werden.

Hier ist der relevante Output aus der Aufgabe:

summary(lm(schlaf$qualitaet ~ schlaf$minuten)):

Die für den t-Test relevanten Angaben von t-Wert und p-Wert befinden sich ausschließlich in der ℹ️ zweiten Zeile der Tabelle "Coefficients".

Der linke rot markierte Wert (0.13951) ist der Regressionskoeffizient b, also die Steigung der Regressionsgerade in der Stichprobe. Es handelt sich auch um einen Schätzwert für die Population (Estimate).

Es gibt in der Stichprobe also einen positiven Zusammenhang. Und wenn man ein Signifikanzniveau von 5% zugrunde legt, ist dieser Zusammenhang auch signifikant (p = 5.13e-05 = 5.13 x 10-5 = 0.0000513).

Das heißt: Vom Zusammenhang in der Stichprobe können wir auch auf einen solchen Zusammenhang in der Population schließen.

ℹ️ Hier ist ein ähnliches Beispiel (mit Streudiagramm).

Lösungen:

  • 💡  A ist falsch:  Die Minuten sind der Prädiktor. schlaf$qualitaet ~ schlaf$minuten. Qualität by Minuten. Die Qualität richtet sich gewissermaßen nach den Minuten. Siehe auch oben das Beispiel mit Streudiagramm.
  • 💡  B ist richtig:  Hier ist wohl gemeint, dass keine multiple Regression durchgeführt wurde, sondern nur eine einfache Regression. Präziserweise müsste man jedoch eigentlich noch dazusagen, dass hier nicht bloß eine Regressionsanalyse (mit dem lm()-Befehl) durchgeführt wurde, sondern ein t-Test zur Überprüfung des Regressionskoeffizienten. ℹ️ Hier einmal der direkte Vergleich der beiden Verfahren..
  • 💡  C ist richtig:  p = 5.13e-05 = 5.13 x 10-5 = 0.0000513
  • 💡  D ist richtig:  …desto höher tendenziell (oder im Durchschnitt) die Schlafqualität.
  • 💡  E ist falsch:  r2 = 0.3541

Ein Gedanke zu „Lösungen 09 / 2021 – Teil 2“

  1. Danke lieber Guido.

    Rückblickend und ohne die vermehrte Produktion von Stresshormonen, was bei mir gelegentlich zu kognitiven Blockaden führt ;)) in der Prüfungssituatin, war die Klausur doch recht einfach.

    Liebe grüße aus Berlin

Schreibe einen Kommentar