(1) Deskriptive & Inferenzstatistik
Was gehört nicht zur deskriptiven Statistik?
□ Tabellen erstellen, um einen systematischen Überblick über die Daten zu erhalten.
□ Die Verteilung der Daten grafisch darstellen.
□ Kennwerte berechnen, um die zentrale Tendenz und Streuung der Daten zu quantifizieren.
□ Parameter schätzen, um die Daten auf Populationsebene einzuordnen.
□ Tabellen erstellen, um einen systematischen Überblick über die Daten zu erhalten.
□ Die Verteilung der Daten grafisch darstellen.
□ Kennwerte berechnen, um die zentrale Tendenz und Streuung der Daten zu quantifizieren.
\(\times\) Parameter schätzen, um die Daten auf Populationsebene einzuordnen.
\(\quad \rightarrow\) Parameterschätzung zählt zur Inferenzstatistik. Immer dann, wenn wir von einer Stichprobe auf die Grundgesamtheit verallgemeinern wollen, benötigen wir inferenzstatistische Methoden.
(2) Wahr oder falsch: Stichprobenkennwerteverteilung
Welche der folgenden Aussagen sind wahr und welche falsch?
Was ist die Stichprobenkennwerteverteilung (SKV)?
□ Die SKV ist eine theoretische Verteilung.
□ Die SKV gibt die Verteilung eines Kennwerts bei bestimmter Stichprobengröße an.
\(\checkmark\) Die SKV ist eine theoretische Verteilung.
\(\quad \rightarrow\) Auf die Stichprobenkennwerteverteilung kommen wir durch ein Gedankenexperiment. Wenn wir unendlich viele Stichproben aus einer Population ziehen würden (als Zufallsexperiment), und für jede dieser Stichproben je einen bestimmten Kennwert (z.B. Mittelwert) berechneten, dann würden diese Stichprobenkennwerte eine Verteilung bilden. Diese Verteilung ist die SKV.
In Wirklichkeit kann man natürlich nicht unendlich viele Stichproben ziehen. Deswegen handelt es sich um eine theoretische Verteilung. Wir nutzen sie lediglich, um die Unsicherheit zu bemessen, mit der wir Aussagen auf Basis von einer oder wenigen Stichproben über die Grundgesamtheit treffen.
\(\checkmark\) Die SKV gibt die Verteilung eines Kennwerts bei bestimmter Stichprobengröße an.
\(\quad \rightarrow\) Richtig. Für jede beliebige Stichprobengröße gibt es eine SKV. Das liegt daran, dass eine geringere Stichprobengröße eine größere Unsicherheit der Schätzung bedeutet. Der Erwartungswert der Verteilung ändert sich zwar nicht durch die Stichprobengröße. Allerdings fließt das n in die Berechnung der Varianz bzw. des Standardfehlers der Verteilung ein. Durch diese unterschiedlich große Streuung unterscheiden sich SKVs verschiedener Stichprobengröße.
Worauf bezieht sich die SKV?
□ Es existiert für jede Populationsverteilung genau eine SKV.
□ Für Mittelwert, Standardabweichung, b-Gewichte usw. können SKVs gebildet werden.
\(\times\) Es existiert für jede Populationsverteilung genau eine SKV.
\(\quad \rightarrow\) Falsch. Wir können sehr viele unterschiedliche Parameter schätzen, jeweils mit Hilfe unterschiedlicher Stichprobenkennwerteverteilungen. Zudem existieren für verschiedene Stichprobengrößen unterschiedliche SKVs (s.o.).
\(\checkmark\) Für Mittelwert, Standardabweichung, b-gewichte usw. können SKVs gebildet werden. \(\quad \rightarrow\) Richtig. Für jeden Kennwert, der für Stichproben berechnet werden kann, können wir SKVs bilden und dadurch inferenzstatistische Schlüsse ziehen. Die SKVs haben z.T. lediglich unterschiedliche Eigenschaften je nach Kennwert.
Wie ist die Verteilung der SKV?
□ Bei normaler Populationsverteilung ist die SKV auch normal.
□ Mit steigender Stichprobengröße nähert sich die SKV einer Normalverteilung an.
\(\times\) Bei normaler Populationsverteilung ist die SKV auch normal.
\(\quad \rightarrow\) Für die Stichprobenmittelwerteverteilung, das prominenteste Beispiel, ist dieser Zusammenhang korrekt. Jedoch gilt dies nicht für alle schätzbaren Parameter (z.B. die Varianz).
\(\checkmark\) Mit steigender Stichprobengröße nähert sich die SKV einer Normalverteilung.
\(\quad \rightarrow\) Korrekt. Grund dafür ist der zentrale Grenzwertsatz. Dabei wird das Ziehen von Stichproben mit den zugehörigen Kennwerten aus der Population als Zufallsexperiment betrachtet und die einzelnen Kennwerte als Realisierung von Zufallsvariablen. Unabhängige Ziehungen von Stichproben(kennwerten) aus derselben Population mit einer nicht übermächtigen Verteilung des Merkmals folgen dem zentralen Grenzwertsatz.
Demnach ist die Verteilung dieser Kennwerte eine Normalverteilung, wenn die Stichprobe »groß« ist. Wie groß die Stichprobe sein muss, hängt davon ab, wie stark die Verteilung des Merkmals in der Population von einer Normalverteilung abweicht. Dies gilt für alle SKVs - bei ausreichender Stichprobengröße.
Wie ist die zugrundeliegende Populationsverteilung?
□ Eine normale SKV weist auf eine normale Populationsverteilung hin.
\(\times\) Eine normale SKV weist auf eine normale Populationsverteilung hin.
\(\quad \rightarrow\) Falsch. Nach dem zentralen Grenzwertsatz nähern sich alle SKVs mit zunehmender Stichprobengröße einer Normalverteilung an, unabhängig von der Verteilung in der Population. Deshalb können wir von einer normalverteilten SKV nicht auf die Populationsverteilung schließen, zumindest nicht ohne zusätzliche Information über die Stichprobengröße.
(3) Wahr oder falsch: Stichprobenkennwerteverteilung des Mittels
Was ist die Stichprobenkennwerteverteilung des Mittels (SKV-M)?
□ Die SKV-M gibt die Verteilung des Mittels bei bestimmter Stichprobengröße an.
\(\checkmark\) Die SKV-M gibt die Verteilung des Mittels bei bestimmter Stichprobengröße an.
\(\quad \rightarrow\) Korrekt. Durch den Standardfehler bestimmt die Stichprobengröße die Verteilung der SKVs-M mit (s.o.).
Worauf bezieht sich die SKV-M?
□ Es existiert für jede Populationsverteilung genau eine SKV-M.
\(\times\) Es existiert für jede Populationsverteilung genau eine SKV-M.
\(\quad \rightarrow\) Falsch. Es existieren für jede Populationsverteilung so viele SKVs-M, wie Stichproben unterschiedlicher Größen daraus gezogen werden können (potenziell unendlich viele).
Wie ist die Verteilung der SKV-M?
□ Bei normaler Populationsverteilung ist die SKV-M auch normal.
□ Mit steigender Stichprobengröße nähert sich die SKV-M einer Normalverteilung an.
□ Der Erwartungswert der SKV-M entspricht dem Populationsmittel.
□ Die Varianz der SKV-M entspricht der Populationsvarianz.
□ Nimmt man eine viermal so große Stichprobe, halbiert sich der Standardfehler.
\(\checkmark\) Bei normaler Populationsverteilung ist die SKV-M auch normal.
\(\quad \rightarrow\) Korrekt. Dies gilt unabhängig von der Stichprobengröße.
\(\checkmark\) Mit steigender Stichprobengröße nähert sich die SKV-M einer Normalverteilung an.
\(\quad \rightarrow\) Richtig. Dies gilt unabhängig von der Verteilung der Rohwerte in der Population.
\(\checkmark\) Der Erwartungswert der SKV-M entspricht dem Populationsmittel.
\(\quad \rightarrow\) Korrekt. Der Mittelwert ist ein erwartungstreuer Schätzer des Populationsmittels. Das bedeutet, dass Stichprobenmittelwerte den Erwartungswert (Mittelwert als Parameter in der Population \(\mu\)) nicht systematisch über- oder unterschätzen.
\(\times\) Die Varianz der SKV-M entspricht der Populationsvarianz.
\(\quad \rightarrow\) Falsch. Dies gilt nur für den Spezialfall n = 1. Die Varianz der SKV-M \(\sigma_{\bar{x}}^2\) ist der quadrierte Standardfehler, der sich als \(\sigma_{\bar{x}}^2 =\) \(\frac{\sigma^2}{n}\) ergibt. Darin enthalten ist nicht nur die Populationsvarianz \(\sigma^2\), sondern auch die Stichprobengröße, um die Unsicherheit der Schätzung zu quantifizieren. Je größer unsere Stichprobe ist, desto mehr »wissen« wir über die Population. Somit verbessert sich unsere Schätzung: Sie wird sicherer, da wir mit geringerer Wahrscheinlichkeit viele extreme Merkmalsträger in unserer Stichprobe haben und somit die Verhältnisse in der Population verschätzen.
\(\checkmark\) Nimmt man eine viermal so große Stichprobe, halbiert sich der Standardfehler.
\(\quad \rightarrow\) Korrekt. Um diesen Zusammenhang zu erkennen, müssen wir den Satz nur als Gleichung darstellen und umformen:
\(\begin{aligned} \frac{1}{2}\cdot \sigma_{\bar{x}} &= \sqrt{\frac{\sigma^2}{4 \cdot n}}\\ &= \sqrt{\frac{1}{4} \cdot \frac{\sigma^2}{n}}\\ &= \frac{1}{2} \cdot \sqrt{\frac{\sigma^2}{n}}\\ &= \frac{1}{2} \cdot \sigma_{\bar{x}}\\ \end{aligned}\)
Wie ist die zugrundeliegende Populationsverteilung?
□ Eine normale SKV-M weist auf eine normale Populationsverteilung hin.
\(\times\) Eine normale SKV-M weist auf eine normale Populationsverteilung hin.
\(\quad \rightarrow\) Falsch. Wenn die Stichprobe »groß« ist, ist die zugehörige SKV-M nach dem zentralen Grenzwertsatz (s.o.) unabhängig von der Populationsverteilung normalverteilt.
Zusatzaufgabe - Wahr oder falsch: Stichprobenkennwerteverteilung der Varianz
(nicht klausurrelevant!)
Was ist die Stichprobenkennwerteverteilung der Varianz (SKV-V)?
□ Die SKV-V gibt die Verteilung der Varianz bei bestimmter Stichprobengröße an.
\(\checkmark\) Die SKV-V gibt die Verteilung der Varianz bei bestimmter Stichprobengröße an.
\(\quad \rightarrow\) Richtig. (Hier ist die Stichprobenvarianz \(s^2\) (als Kennwert) für eine gegebene Population, nicht die Populationsvarianz \(\sigma^2\) gemeint.)
Wie ist die Verteilung der SKV-V?
□ Bei normaler Populationsverteilung ist die SKV-V auch normal.
□ Mit steigender Stichprobengröße nähert sich die SKV-V einer Normalverteilung an.
□ Der Erwartungswert der SKV-V entspricht der Populationsvarianz.
□ Die SKV-V entspricht bei normalverteilter Population einer \(\chi^2\) -Verteilung.
□ Nimmt man eine viermal so große Stichprobe, halbiert sich der Standardfehler.
\(\times\) Bei normaler Populationsverteilung ist die SKV-V auch normal.
\(\quad \rightarrow\) Im allgemeinen Fall ist diese Aussage falsch. Die SKV-V entspricht bei beliebiger Stichprobengröße einer \(\boldsymbol{\chi^2}\)-Verteilung mit dem Erwartungswert \(\mu_{s^2} = n\) und der Varianz \(\sigma^2_{s^2} = 2n\). Diese nähert sich erst mit steigender Stichprobengröße (\(\rightarrow \infty\)) einer Normalverteilung an.
\(\checkmark\) Mit steigender Stichprobengröße nähert sich die SKV-V einer Normalverteilung an.
\(\quad \rightarrow\) Korrekt. Mit steigender Stichprobengröße entspricht die SKV-V mit \(\sigma^2 \sim \chi^2(n)\) einer Normalverteilung mit \(\sigma^2 \sim N(\sigma^2,(\sigma^2 \cdot \sqrt{\frac{2}{n-1}})\).
\(\checkmark\) Der Erwartungswert der SKV-V entspricht der Populationsvarianz.
\(\quad \rightarrow\) Korrekt. \(\mu_{s^2} = \sigma^2\).
\(\checkmark\) Die SKV-V entspricht bei normalverteilter Population einer \(\chi^2\)-Verteilung.
\(\quad \rightarrow\) Korrekt. \(s^2 \sim \chi^2(n)\)
\(\times\) Nimmt man eine viermal so große Stichprobe, halbiert sich der Standardfehler.
\(\quad \rightarrow\) Falsch. Dieser Zusammenhang gilt für die Stichprobenmittelwerteverteilung, aber nicht für die SKV-V.
Wie ist die zugrundeliegende Populationsverteilung?
□ Eine normale SKV-V weist auf eine normale Populationsverteilung hin.
\(\times\) Eine normale SKV-V weist auf eine normale Populationsverteilung hin.
\(\quad \rightarrow\) Falsch. Die SKV-V ist \(\chi^2\)-verteilt. Mit steigender Stichprobengröße nähert sie sich einer Normalverteilung - unabhängig von der Verteilung in der Population.
(4) Intelligenzquotient
Es sei bekannt, dass Intelligenzquotientwerte in der Population normalverteilt sind mit x ~ N(100, 100)- vgl. Übungsblatt “Stetige Zufallsverteilungen”.
Du ziehst eine Zufallsstichprobe mit N = 25 Psychologiestudierenden und erhältst einen Mittelwert von \(\bar{x}\) = 106 und eine Standardabweichung von s = 6.
(a) Welchen IQ-Mittelwert müsste eine zufällig ausgewählte Stichprobe mindestens aufweisen, um im Mittel zu den oberen 2,5% zu gehören?
(b) Welchen Mittelwert \(\boldsymbol{\bar{x}}\) müsste eine zufällig ausgewählte Stichprobe mindestens aufweisen, um nicht zu den unteren 5% zu gehören?
(c) Wie wahrscheinlich ist es, dass eine zufällig ausgewählte Stichprobe einen IQ-Mittelwert zwischen \(\boldsymbol{\bar{x}}\) = 80 und \(\boldsymbol{\bar{x}}\) = 120 hat?
(d) Wie wahrscheinlich ist es, bei N = 25 einen Mittelwert von \(\boldsymbol{\bar{x}}\) = 106 oder größer aus der Gesamtpopulation zu erhalten?