Lösungen 09 / 2022 – Teil 2 | Statistik FernUni Hagen

ℹ️ Hinweis ← (hier klicken)

Aufgabe 8

Hier ist ein ähnliches Beispiel:

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Lösungen:

💡 A ist falsch: In der Aufgabe ist der ℹ️ getrimmte Mittelwert identisch zum "normalen" Mittelwert.
💡 B ist richtig: Eine negative Kurtosis bedeutet, dass die Verteilung "breitgipfeliger" ist als eine NV.
💡 C ist falsch: In der Aufgabe ist die Spannweite / Range gleich 4.
💡 D ist falsch: mad ist nicht das "winsorisierte Mittel", sondern der ℹ️ Median der absoluten Abweichungen vom Median.
💡 E ist richtig: sd ist Standard Deviation / Standardabweichung.

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Aufgabe 9

In dieser Aufgabe ist eine Tabelle für die Korrelation von 7 verschiedenen Merkmalen/Variablen dargestellt. Für jede Variable wurde die Korrelation mit jeder anderen Variable berechnet.

In den Spaltenüberschriften findet man die Namen der Variablen und in Klammern dahinter jeweils eine Nummer. In der linken Spalte sind dann nur noch die Nummern der einzelnen Variablen aufgeführt. Aber es sind dieselben Variablen gemeint. Es gibt also für jede Variable eine eigene Spalte, aber auch für jede Variable eine Zeile. Und jede Zelle in der Tabelle steht für eine bestimmte Kombination von zwei Variablen.

Die Korrelation zwischen:

"Poor sleep quality" und "Overall social media use" ist 0.24.
"Poor sleep quality" und "Nighttime-specific social media use" ist 0.34.
"Poor sleep quality" und "Emotional investment" ist 0.28.
usw.

Die Inhalte unter der Diagonale kann man weglassen, weil sonst jede Kombination zweimal vorkommt. Z.B. ist die Korrelation zwischen Variable 2 und 6 dieselbe, wie die zwischen 6 und 2.

Die in der Tabelle dargestellten ℹ️ Sternchen (**) sind für diese Aufgabe irrelevant.

Lösungen:

💡 A ist richtig: Die Korrelation zwischen den beiden Variablen 1 und 3 ist positiv (plus 0,34), wobei eine hohe "poor sleep quality" für einen schlechten Schlaf steht.
💡 B ist falsch: In der Tabelle gibt es auch Korrelationen, die (betragsmäßig) kleiner als 0,3 sind. Also gemäß Cohen's Konventionen in jedem Fall mittel oder sogar klein.
💡 C ist falsch: Der Zusammenhang zwischen den beiden Variablen 6 und 7 ist plus 0,53.
💡 D ist falsch: Gemäß Fußnote unter der Tabelle ist die Anzahl der untersuchten Jugendlichen vermutlich 467. Die sechs Tabellenzeilen stehen für die ersten sechs Variablen. Insgesamt gibt es 7 Variablen, deren Zusammenhang mit jeweils einer anderen Variable untersucht wird.
💡 E ist richtig: Die Korrelation zwischen den beiden Variablen 2 und 3 ist positiv (plus 0,67).

Aufgabe 10

Es ist die Kurve einer (vermutlich) ℹ️ Normalverteilung abgebildet.

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Es handelt sich um eine WSK-Verteilung, weil die Y-Achse mit "Density" (für die WSK-Dichte) beschriftet ist.

Lösungen:

💡 A ist falsch: Auf der Y-Achse ist die WSK-Dichte abgetragen.
💡 B ist falsch: Die ↗️ Chi-Quadrat-Verteilung ist auf der linken Seite durch die Null begrenzt, weil das Chi-Quadrat nur positive Werte annehmen kann. Das bedeutet, dass es auf der X-Achse keinen negativen Werte geben kann.
💡 C ist richtig: Es ist eine WSK-Verteilung. Bei jeder WSK-Verteilung ist die Summe aller WSKen immer gleich 1.
💡 D ist falsch: Diese Kurve ist eingipfelig, also unimodal.
💡 E ist richtig: Die Verteilung ist symmetrisch, weil die rechte Seite ein exaktes Spiegelbild der linken Seite ist.

Aufgabe 11

Bei dieser Aufgabe geht es darum, ein paar Informationen aus einem umständlichen und länglichen Text abzulesen. Die größte Schwierigkeit besteht vor allem darin, zu verstehen, worum es überhaupt geht.

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Aufgabe 12

Hier ist ein Beispiel zur Veranschaulichung:

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Lösungen:

💡 A ist falsch: R unterscheidet zwischen Groß- und Kleinschreibung. Eine MEAN()-Funktion mit großen Buchstaben gibt es nicht.
💡 B ist richtig: Wenn es fehlende Werte gibt, die als NA erfasst sind, müsste man noch den Parameter na.rm angeben. Zum Beispiel so: mean(klinikA$alter, na.rm=T).
💡 C ist falsch: Da es sich bei zielBeginn um ein frei formuliertes Textfeld handelt, ergibt es keinen Sinn, diese Variable als Faktor-Datentyp abzulegen.
💡 D ist richtig: So wie der Befehl da steht, wird er nicht funktionieren, weil die Anführungszeichen falsch sind (einmal unten und einmal oben). Aber das war vermutlich nur ein Flüchtigkeitsfehler des Lehrstuhls. Die Aufgabe wurde gutgeschrieben. Der folgende Befehl würde in jedem Fall so funktionieren, wie beschrieben: klinikA[2, "geschlecht"]
💡 E ist richtig: Alle R-Objekte kann man in einer .RData-Datei abspeichern.

Aufgabe 13

Lösungen:

💡 A ist richtig: Ein Randomisierungstest ist immer eine Alternative zu einem "normalen" Signifikanztest. Und die Durchführbarkeit bei einer "Verletzung der Normalverteilungsannahme" gilt als einer der beiden ℹ️ Vorteile des Resampling.
💡 B ist richtig: Der U-Test ist die Alternative für unabhängige Stichproben.
💡 C ist falsch: Eine A-priori Poweranalyse wird normalerweise durchgeführt bevor ich überhaupt eine Stichprobe habe, denn ich will ja wissen, wie groß die Stichprobe sein soll. Siehe auch unten bei Aufgabe 15A.
💡 D ist falsch: Wie bei jedem anderen Signifikanztest, so wird auch beim Randomisierungstest ein p-Wert berechnet.
💡 E ist richtig: Die Normalverteilung in den Populationen gilt als Voraussetzung für die Varianzanalyse.

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Aufgabe 14

Lösungen:

💡 A ist richtig: Das ist der Zentrale Grenzwertsatz. Siehe Sedlmeier S.337. Diese Aussage ist identisch zu Aufgabe 4A aus der Klausur 03/2022.
💡 B ist richtig: Die Standardnormalverteilung ist eine Normalverteilung mit dem Mittelwert 0 und der Standardabweichung 1.
💡 C ist richtig
💡 D ist richtig: Siehe Sedlmeier S.335.
💡 E ist richtig: Das ist genau die Definition des p-Werts.

Aufgabe 15

Lösungen:

💡 A ist richtig: ℹ️ Beispiel. Zum Vergleich ℹ️ hier auch nochmal Post-hoc. Siehe auch Aufgabe 22D der Klausur 03/2022.
💡 B ist richtig: Post-hoc heißt: Wie war die Power bei einem bestimmten Test (mit einem bestimmten n)? A-Priori heißt: Wie groß muss die Stichprobe sein, um eine bestimmte Power zu erreichen?
💡 C ist richtig: Kleine Power bedeutet: die WSK einen vorhandenen Effekt aufzudecken ist gering. Obwohl es einen Effekt in der Population gibt, wird er nicht aufgedeckt. Also ist das Ergebnis wenig aussagekräftig.
💡 D ist falsch: Je größer Alpha, desto größer die Power. Je größer Alpha, desto kleiner Beta. Und die Power ist Eins minus Beta:
💡 E ist falsch: Die Poweranalyse geht auf Neyman und Pearson zurück, siehe Sedlmeier S.378. Bei Fisher gibt es keine Poweranalyse.

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Aufgabe 16

Lösungen:

💡 A ist falsch: Publikationsbias ist, wenn z.B. signifikante Ergebnisse bei der Veröffentlichung bevorzugt werden. Siehe Sedlmeier S.632.
💡 B ist richtig: Dieser Satz über das p-Hacking wurde (mehr oder weniger wortgleich) aus dem Sedlmeier S.638 übernommen.
💡 C ist richtig: Die dichotome Unterscheidung in "signifikant" und "nicht signifikant" gilt als ein Problem des NHST.
💡 D ist richtig: Ob die Nullhypothese unrealistisch oder wenig informativ ist, ist vielleicht etwas interpretationsbedürftig, aber dieser Satz stammt aus der Vorlesung.
💡 E ist falsch: Das "Reproducibility Projekt" hat das Gegenteil gezeigt. Siehe Sedlmeier S.615. Oder der grüne Kasten auf S.647.

Aufgabe 17

Es soll untersucht werden, ob es einen Zusammenhang zwischen dem Heimatkontinent und der Ernährungsform gibt.

Hier ist ein Beispiel zur Veranschaulichung:

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Lösungen:

💡 A ist richtig: Siehe oben.
💡 B ist falsch: Es gibt insgesamt nur zwei Variablen, den Heimatkontinent und die Ernährungsweise. Siehe oben.
💡 C ist falsch: Den Phi-Koeffizient könnte man nur dann berechnen, wenn es sowohl für den Heimatkontinent als auch für die Ernährungsweise nur zwei verschiedene Ausprägungen gäbe.
💡 D ist falsch: Einen solchen Zusammenhang gibt es dann, wenn die Ernährungsweise auf den verschiedenen Kontinenten unterschiedlich ist. Merkwürdigerweise wurde diese Aufgabe gutgeschrieben...
💡 E ist falsch: Kruskal-Wallis ist die non-parametrische Alternative zur Varianzanalyse. Richtig wäre Chi-Quadrat-Test für zwei Variablen. Siehe oben.

Aufgabe 18

Lösungen:

💡 A ist richtig: Siehe Lernkarten Lagemaße.
💡 B ist richtig: Die Standardabweichung ist immer die Wurzel der Varianz.
💡 C ist richtig: Um einen Z-Wert auszurechnen, braucht man die Standardabweichung der Verteilung. Die Standardabweichung ist ein Streuungsmaß.
💡 D ist richtig: Die Stammbreite muss man angeben. Siehe Eid S.153.
💡 E ist richtig: Das zweite Quartil ist dasselbe wie der Median. Siehe Kontrollfragen Quantile.

Aufgabe 19

Es ist das Ergebnis eines t-Tests für den Regressionskoeffizienten dargestellt.

Hier ist ein ähnliches Beispiel:

Um diese Inhalte zu nutzen, musst du dich anmelden und den Zugriff auf die Klausurlösungen kostenpflichtig erwerben.

Lösungen:

💡 A ist falsch: Extraversion ist der Prädiktor und Intelligenz ist das Kriterium.
💡 B ist falsch: Der p-Wert für den Zusammenhang zwischen Extraversion und Intelligenz ist (in der Aufgabe) 0.715. Also war der t-Test deutlich nicht signifikant.
💡 C ist falsch: Der Anteil der aufgeklärten Varianz ist der Wert bei R-squared.
💡 D ist falsch: Der IQ hat eine andere Maßeinheit als die Extraversion. Siehe oben.
💡 E ist falsch: In der Tabelle "Residuals" findet man nicht der Verteilungskennwerte der AV, sondern nur die der Residuen. Das sind die Abweichungen der Y-Werte von der Regressionsgerade. Min und Max, zum Beispiel, sind die größten Abweichungen von der Regressionsgerade.

5 Gedanken zu „Lösungen 09 / 2022 – Teil 2“

meikeamm sagt:

30. Juli 2023 um 20:49 Uhr

Hallo Guido,

ich verstehe bei der Aufgabe 19 Antwort D nicht ganz. Ich sehe, dass die Maßeinheiten vom IQ und der Extraversion im Streudiagramm unterschiedlich sind. Ich verstehe allerdings gerade nicht so ganz, woher du die Maßeinheiten hast. Wo im Output sehe ich das?

Liebe Grüße
Meike

Zum Antworten anmelden
1. statstutor sagt:
  
  2. August 2023 um 12:22 Uhr
  
  Die Darstellung ist nur ein Beispiel. Aber dass diese beiden Größen auf derselben Skala gemessen werden, ist eher unwahrscheinlich. Die Aussage ist in jedem Fall falsch.
  
  Zum Antworten anmelden
Grotefend sagt:

19. Januar 2023 um 21:42 Uhr

Hallo Guido,
die Lösung zu Frage 17 D verstehe ich nicht.
In der Lösung ist formuliert Ernährungsweise ist „nicht gleich“. Ich das nicht gleichbedeutend mit „unterschiedlich“? Also dachte ich, dass die Frage richtig sein muss.
Könntest du das bitte noch einmal kurz erklären?
Danke und viele Grüße,
Tina

Zum Antworten anmelden
1. statstutor sagt:
  
  20. Januar 2023 um 9:41 Uhr
  
  „Auf den verschiedenen Kontinenten unterschiedlich“ heißt z.B.: in Afrika anders als in Europa.
  
  Zum Antworten anmelden
  1. Grotefend sagt:
    
    21. Januar 2023 um 9:56 Uhr
    
    Oh, ja! Klar, jetzt habe ich meinen Denkfehler! Danke!

Schreibe einen Kommentar Antworten abbrechen

Du musst angemeldet sein, um einen Kommentar abzugeben.