Gütekriterien

(1) Allgemein

Beschreibe die 4 Gütekriterien schriftlich und gib für jedes Gütekriterium einen Schätzer an, der dieses Gütekriterium erfüllt.
Lösung

1. Erwartungstreue

  • Der Erwartungswert der Kennwerteverteilung entspricht dem wahren Wert in der Population.

  • D.h. wenn wir unendlich viele Stichproben aus einer Population ziehen würden und für diese Stichproben jeweils einen bestimmten Kennwert berechnen würden, würden diese aus den Stichproben berechneten Kennwerte im Mittel dem Populationsparameter entsprechen.

  • In der folgenden Abbildung wird dies veranschaulicht. Die beiden Kennwerte, deren Stichprobenkennwerteverteilungen hier abgebildet sind, schätzen denselben Populationsparameter \(\theta\).

    • Der Kennwert, dessen Verteilung in schwarz abgebildet ist, ist erwartungstreu, da der Mittelwert dieser Verteilung dem Parameter \(\theta\) entspricht.
    • Der Kennwert, dessen Verteilung in blau abgebildet ist, ist nicht erwartungstreu, da der Mittelwert dieser Verteilung nicht dem Parameter \(\theta\) entspricht.


  • Beispiele:

    • erwartungstreu: Mittelwert \(x\) für Erwartungswert \(\mu\);
      Stichprobenarianz \(s^2\) für Populationsvarianz \(\sigma^2\) (nur wenn bei Berechnung von \(s^2\) \((n-1)\) im Nenner steht)!
    • nicht erwartungstreu: Median \(x_{med}\) für Erwartungswert \(\mu\);
      Standardabweichung \(s\) für Standardabweichung \(\sigma\)

2. Konsistenz

  • Der Kennwert schätzt den wahren Wert mit zunehmender Stichprobengröße genauer.

  • D.h. die Varianz der Stichprobenverteilung dieses Kennwertes wird kleiner mit zunehmender Stichprobengröße. Dies führt dazu, dass die Schätzung präziser wird.

  • Die folgende Abbildung zeigt die Stichprobenverteilungen eines konsistenten Schätzers bei wachsendem \(n\) und den Populationsparameter \(\theta\), der durch diesen Schätzer geschätzt wird.

    • Die Varianz der Stichprobenverteilung (und damit auch die Unsicherheit der Schätzung) wird mit zunehmender Stichprobengröße kleiner.
    • Bei \(n=100000\) ist die Stichprobenverteilung so schmal, dass es sehr unwahrscheinlich wird, beim Ziehen einer Stichprobe und Berechnen des Schätzers den Populationsparameter zu verfehlen.


  • Beispiele:

    • konsistent: Mittelwert \(x\) für Erwartungswert \(\mu\);
      Stichprobenvarianz \(s^2\) für Populatoinsvarianz \(\sigma^2\) (auch wenn bei Berechnung von \(s^2\) \(n\) im Nenner steht);
      Median \(x_{med}\) für Erwartungswert \(\mu\) (gegeben, dass der Merkmal in der Population normalverteilt ist);
      Standardabweichung \(s\) für Standardabweichung \(\sigma\)
    • nicht konsistent: ein Wert der Stichprobe für Erwartungswert \(\mu\)

3. Effizienz

  • Allgemein: Je kleiner die Varianz der Stichprobenkennwerteverteilung, desto größer ist die Effizienz des entsprechenden Schätzers (Für erwartungstreue Schätzer).

  • Eine kleinere Varianz der Stichprobenkennwerteverteilung bedeutet, dass es weniger wahrscheinlich ist, den entsprechenden Kennwert in einer Stichprobe zu haben, der sich stark vom Mittelwert dieser Verteilung (und somit vom Populationsparameter) unterscheidet. Also, drückt eine kleinere Varianz eine präzisere Schätzung und somit eine geringere Unsicherheit aus.

  • Je weniger die Unsicherheit der Schätzung, desto effizienter ist diese Schätzung.

  • Der Kennwert schätzt den wahren Wert relativ präzise, wenn er einen geringeren Standardfehler als ein anderer Schätzer aufweist.

  • Die folgende Abbildung veranschaulicht die relative Effizienz von Mittelwert und Median als Schätzer für den Erwartungswert einer Gleichverteilung.

    • Die Varianz der Stichprobenverteilung des Mittelwerts ist kleiner als die Varianz der Stichprobenverteilung des Medians.
    • Deswegen ist Mittelwert relativ effizient als Schätzer für den Erwartungswert einer Gleichverteilung im Vergleich zum Median.


  • Beispiele:

    • relativ effizient: Mittelwert \(x\) für Erwartungswert \(\mu\) im Vergleich zu Median \(x_{med}\)
    • absolut effizient: Mittelwert \(x\) für Erwartungswert \(\mu\) im Vergleich zu den anderen Kennwerten der zentralen Tendenz (z.B. \(x_{med}\), \(x_{mod}\)). Mit “absolut effizient” ist gemeint, dass ein bestimmter Kennwert einen Parameter effizienter als alle anderen Kennwerte schätzt.

4. Suffizienz

  • In dem Schätzer / den Schätzern sind alle relevanten Informationen über den Parameter oder die Verteilung enthalten.

  • Man kann also mehrere Schätzer verwenden, um eine Verteilung zu schätzen.

  • Welche und wieviele Schätzer man braucht, ist natürlich von der Verteilung abhängig.

  • Beispiele:

    • Normalverteilung: Mittelwert und Standardabweichung sind zusammen suffizient.
    • Normalverteilung mit bekannter Standardabweichung: Mittelwert ist suffizient.


(2) Lückentext

Die Eignung von __________ als Schätzer von Populationsparametern wird an den folgenden 4 Gütekriterien bemessen: __________, __________, __________ und __________.
Ein Schätzer ist __________, wenn der Erwartungswert der Stichprobenkennwerteverteilung des Stichprobenkennwertes mit dem Parameter identisch ist.

__________ stellt beispielsweise eine erwartungstreue Schätzung des Populationsparameters \(\mu\) dar.
\(s^2 =QS/n\) ist ein Beispiel für einen __________ Schätzer. Wir müssen mit dem Faktor __________ multiplizieren, um die korrekte Varianz zu bekommen.

Ein Stichprobenkennwert heißt __________, wenn er mit wachsender Stichprobengröße stochastisch gegen den Parameter konvergiert. Mit anderen Worten, die Wahrscheinlichkeit, dass der Stichprobenkennwert beliebig nahe an dem Parameter liegt, strebt für \(n \rightarrow \infty\) gegen __________.
Der Schätzer eines Populationsparameters ist umso _________, je _________ der Standardfehler dieses Schätzers ist.
Ein Schätzer ist __________, wenn er alle in der Stichprobe enthaltenen Informationen nutzt.

Das arithmetische Mittel ist ein __________ Schätzer für den Populationsmittelwert \(\mu\), da es die 4 oben genannten Kriterien besser erfüllt als andere Schätzer.


Lösung

Die Eignung von Stichprobenkennwerten als Schätzer von Populationsparametern wird an den folgenden 4 Gütekriterien bemessen: Erwartungstreue, Konsistenz, Effizienz und Suffizienz.
Ein Schätzer ist erwartungstreu, wenn der Erwartungswert der Stichprobenkennwerteverteilung des Stichprobenkennwertes mit dem Parameter identisch ist.

Der Stichprobenmittelwert \(\bar{x}\) stellt beispielsweise eine erwartungstreue Schätzung des Populationsparameters \(\mu\) dar.
\(s^2 =QS/n\) ist ein Beispiel für einen verzerrten Schätzer. Wir müssen mit dem Faktor \(\frac{n}{n/1}\) multiplizieren, um die korrekte Varianz zu bekommen.


Anmerkung

So kommen wir auf den Faktor \(\frac{n}{n/1}\):

  • Wir wollen den Faktor \(x\) bestimmen, um den sich die beiden Varianzschätzungen unterscheiden. Da die wahre Varianz unterschätzt wird, muss der Faktor > 1 sein, um die falsche Varianz zu erhöhen.

\[\frac{QS}{n} \cdot x = \frac{QS}{n-1}\]

  • Dazu stellen wir diese Formel nach \(x\) um. Zur Erinnerung: zum Teilen durch einen Bruch multipliziert man mit dem Kehrwert:

\[x = \frac{QS}{n-1}\cdot \frac{n}{QS}\]

  • Jetzt kürzt sich \(QS\) heraus. Der gesuchte Faktor beträgt

\[x=\frac{n}{n-1}\]

Das ist der Faktor, mit dem man die Varianz \(\frac{QS}{n}\) multiplizieren soll, um die Varianz \(\frac{QS}{n-1}\) zu bekommen.


Ein Stichprobenkennwert heißt konsistent, wenn er mit wachsender Stichprobengröße stochastisch gegen den Parameter konvergiert. Mit anderen Worten, die Wahrscheinlichkeit, dass der Stichprobenkennwert beliebig nahe an dem Parameter liegt, strebt für \(n \rightarrow \infty\) gegen 1.
Der Schätzer eines Populationsparameters ist umso effizienter, je kleiner der Standardfehler dieses Schätzers ist.
Ein Schätzer ist suffizient, wenn er alle in der Stichprobe enthaltenen Informationen nutzt.

Das arithmetische Mittel ist ein optimaler Schätzer für den Populationsmittelwert \(\mu\), da es die 4 oben genannten Kriterien besser erfüllt als andere Schätzer.


Konfidenzintervalle

(3) Intelligenzquotient

Es sei bekannt, dass Intelligenzquotientwerte in der Population normalverteilt sind mit x~N(100,100).
Du ziehst eine Zufallsstichprobe aus N = 25 Psychologiestudierenden und erhältst einen Mittelwert von \(\bar{x}\) = 107 und eine Standardabweichung von \(s\) = 6.

(a) Berechne das 95%-Konfidenzintervall um den Mittelwert.


Lösung

  • Als Erstes bestimmen wir die \(z\)-Werte für die Grenzen des 95%-Konfidenzintervalls. Wir brauchen die \(z\)-Werte, die die mittleren 95% der Verteilung eingrenzen:

    • obere Grenze: \(z_{97.5\%}= 1.96\);
    • untere Grenze: \(z_{2.5\%}= -1.96\).
  • Wir berechnen den Standardfehler des Mittelwerts:

\[\sigma_{\bar{x}} = \frac{\sigma_x}{\sqrt{n}}= \frac{10}{\sqrt{25}}=2\]

  • Jetzt können wir schon die Werte in die Formel für die Grenzen des Konfidenzintervalls einsetzen:

    • obere Grenze:
      \(\begin{aligned} x_o & = \bar{x}+ z_{1-\frac{\alpha}{2}}\cdot \sigma_{\bar{x}}\\ & = 107+1.96 \cdot 2 = 110.92 \end{aligned}\)
    • untere Grenze:
      \(\begin{aligned} x_u & = \bar{x}- z_{1-\frac{\alpha}{2}}\cdot \sigma_{\bar{x}}\\ & = 107-1.96 \cdot 2 = 103.08 \end{aligned}\)
Der 95%-Konfidenzintervall um den Mittelwert ist \([103.08, 110.92]\).


(b) Eine andere Forscherin hat in ihrer Studie mit N = 25 Personen ein deutlich breiteres 95%-Konfidenzintervall erhalten. Woran liegt das?


Lösung

Allgemein kann ein breiteres Konfidenzintervall aus den folgenden drei Gründen entstehen:

  • größeres Konfidenzniveau (z.B. 99%- statt 95%-Konfidenzintervall): wir berücksichtigen in diesem Fall einfach einen größeren Anteil der Verteilung
  • kleinerer Stichprobenumfang: der Standardfehler wird in diesem Fall größer und damit auch die Unsicherheit der Schätzung
    \[\sigma_{\bar{x}} = \frac{\sigma_x}{\sqrt{n}}\]
  • größere Streuung in der Stichprobe (\(s\)) bzw. Population (\(\sigma\)): dann wird der Standardfehler auch größer.

In diesem Fall hat die Forscherin eine Stichprobe der gleichen Größe \(n = 25\) und auch gleiches Konfidenzniveau (95%-KI). Deswegen muss es an einer größeren Streuung in ihrer Stichprobe (wenn wir davon ausgehen, dass diese der gleichen Population entnommen wurde) gelegen haben.


(c) Was würde passieren, wenn man statt N = 25 N = 100 Personen untersucht?


Lösung

Der Standardfehler würde sich verkleinern, da er von der Stichprobengröße anhängig ist: \(\sigma_{\bar{x}} = \frac{\sigma_x}{\sqrt{n}}\).
Das Konfidenzintervall würde deswegen (ceteris paribus = unter sonst gleichen Bedingungen) kleiner werden, d.h. die Schätzung wäre präziser.


(d) Was würde passieren, wenn wir die Irrtumswahrscheinlichkeit von 5% auf 10% setzen?


Lösung

Das würde einem 90%-Konfidenzintervall entsprechen. Das Konfidenzintervall würde (ceteris paribus) schmaler werden, da wir eine größere Unsicherheit tolerieren. Der zugehörige \(z\)-Wert wäre bei dem 90%-KI mit 1.65 kleiner als bei einer Irrtumswahrscheinlichkeit von 5% (\(z=1.96\)). Dadurch wären die Abweichungen von \(x\) nach unten und oben jeweils kleiner und das KI somit schmaler.



(4) grafische Darstellung

Beschreibe die folgende Abbildung. Gehe dabei auf die folgenden Fragen ein:

Was zeigt sie?

Lösung

Diese Abbildung zeigt 95%-Konfidenzintervalle für die Mittelwerte (“Xbar Values” auf der \(y\) Achse) aus 100 Zufallsstichproben der Größe \(n=60\).


Wo liegt der wahre Parameter?

Lösung

Der wahre Parameter ist als horizontale rote Linie dargestellt und liegt bei ca. 2.3.


Ist die Breite der KIs immer gleich?

Lösung

Ja, die Breite der Konfidenzintervalle ist immer die gleiche. Das hängt mit der Sicherheit von 95% zusammen, die in diesem Fall festgelegt wurde und auch mit der Tatsache, dass wir Stichproben der gleichen Größe ziehen.


Warum sind manche Balken rot?
Lösung

Das sind die Konfidenzintervalle, die den wahren Parameter nicht umschließen: sie liegen entweder vollständig über der roten horizontalen Linie oder vollständig unter dieser Linie. Es gibt genau 5 solche Konfidenzintervalle aus 100. Dies veranschaulicht die Idee eines 95%-Konfidenzintervalls: wenn wir immer wieder Stichproben aus der Population ziehen und die Konfidenzintervalle um die Stichprobenmittelwerte berechnen, werden 5% dieser Konfidenzintervalle auf lange Sicht den Populationsparameter nicht umschließen.



(5) inhaltliche Interpretation

Dein Kollege hat in der Publikation seiner Studie vorbildhaft das KI angegeben und folgende Interpretation dazu geschrieben:

„There is a 95% chance that the true population mean falls within the interval from 1.7 to 3.8.“

Was ist an dieser Interpretation problematisch? Begründe kurz.


Lösung

Ein Populationsparameter (in diesem Fall der Erwartungswert) ist immer ein fester Wert. Deswegen ist es falsch zu sagen, dass er mit einer bestimmten Wahrscheinlichkeit innerhalb eines Konfidenzintervalls liegt.
Die richtige Interpretation wäre die folgende: wenn wir immer wieder neue Stichproben aus der gegebenen Population ziehen, Mittelwerte berechnen und um diese Mittelwerte 95%-Konfidenzintervalle berechnen, werden 95% dieser Konfidenzintervalle den Erwartungswert umschließen.