(1) Allgemein
Beschreibe die 4 Gütekriterien schriftlich und gib für jedes Gütekriterium einen Schätzer an, der dieses Gütekriterium erfüllt.
1. Erwartungstreue
Der Erwartungswert der Kennwerteverteilung entspricht dem wahren Wert in der Population.
D.h. wenn wir unendlich viele Stichproben aus einer Population ziehen würden und für diese Stichproben jeweils einen bestimmten Kennwert berechnen würden, würden diese aus den Stichproben berechneten Kennwerte im Mittel dem Populationsparameter entsprechen.
In der folgenden Abbildung wird dies veranschaulicht. Die beiden Kennwerte, deren Stichprobenkennwerteverteilungen hier abgebildet sind, schätzen denselben Populationsparameter \(\theta\).
Beispiele:
2. Konsistenz
Der Kennwert schätzt den wahren Wert mit zunehmender Stichprobengröße genauer.
D.h. die Varianz der Stichprobenverteilung dieses Kennwertes wird kleiner mit zunehmender Stichprobengröße. Dies führt dazu, dass die Schätzung präziser wird.
Die folgende Abbildung zeigt die Stichprobenverteilungen eines konsistenten Schätzers bei wachsendem \(n\) und den Populationsparameter \(\theta\), der durch diesen Schätzer geschätzt wird.
Beispiele:
3. Effizienz
Allgemein: Je kleiner die Varianz der Stichprobenkennwerteverteilung, desto größer ist die Effizienz des entsprechenden Schätzers (Für erwartungstreue Schätzer).
Eine kleinere Varianz der Stichprobenkennwerteverteilung bedeutet, dass es weniger wahrscheinlich ist, den entsprechenden Kennwert in einer Stichprobe zu haben, der sich stark vom Mittelwert dieser Verteilung (und somit vom Populationsparameter) unterscheidet. Also, drückt eine kleinere Varianz eine präzisere Schätzung und somit eine geringere Unsicherheit aus.
Je weniger die Unsicherheit der Schätzung, desto effizienter ist diese Schätzung.
Der Kennwert schätzt den wahren Wert relativ präzise, wenn er einen geringeren Standardfehler als ein anderer Schätzer aufweist.
Die folgende Abbildung veranschaulicht die relative Effizienz von Mittelwert und Median als Schätzer für den Erwartungswert einer Gleichverteilung.
Beispiele:
4. Suffizienz
In dem Schätzer / den Schätzern sind alle relevanten Informationen über den Parameter oder die Verteilung enthalten.
Man kann also mehrere Schätzer verwenden, um eine Verteilung zu schätzen.
Welche und wieviele Schätzer man braucht, ist natürlich von der Verteilung abhängig.
Beispiele:
(2) Lückentext
Die Eignung von __________ als Schätzer von Populationsparametern wird an den folgenden 4 Gütekriterien bemessen: __________, __________, __________ und __________.
Ein Schätzer ist __________, wenn der Erwartungswert der Stichprobenkennwerteverteilung des Stichprobenkennwertes mit dem Parameter identisch ist.
__________ stellt beispielsweise eine erwartungstreue Schätzung des Populationsparameters \(\mu\) dar.
\(s^2 =QS/n\) ist ein Beispiel für einen __________ Schätzer. Wir müssen mit dem Faktor __________ multiplizieren, um die korrekte Varianz zu bekommen.
Ein Stichprobenkennwert heißt __________, wenn er mit wachsender Stichprobengröße stochastisch gegen den Parameter konvergiert. Mit anderen Worten, die Wahrscheinlichkeit, dass der Stichprobenkennwert beliebig nahe an dem Parameter liegt, strebt für \(n \rightarrow \infty\) gegen __________.
Der Schätzer eines Populationsparameters ist umso _________, je _________ der Standardfehler dieses Schätzers ist.
Ein Schätzer ist __________, wenn er alle in der Stichprobe enthaltenen Informationen nutzt.
Das arithmetische Mittel ist ein __________ Schätzer für den Populationsmittelwert \(\mu\), da es die 4 oben genannten Kriterien besser erfüllt als andere Schätzer.
Die Eignung von Stichprobenkennwerten als Schätzer von Populationsparametern wird an den folgenden 4 Gütekriterien bemessen: Erwartungstreue, Konsistenz, Effizienz und Suffizienz.
Ein Schätzer ist erwartungstreu, wenn der Erwartungswert der Stichprobenkennwerteverteilung des Stichprobenkennwertes mit dem Parameter identisch ist.
Der Stichprobenmittelwert \(\bar{x}\) stellt beispielsweise eine erwartungstreue Schätzung des Populationsparameters \(\mu\) dar.
\(s^2 =QS/n\) ist ein Beispiel für einen verzerrten Schätzer. Wir müssen mit dem Faktor \(\frac{n}{n/1}\) multiplizieren, um die korrekte Varianz zu bekommen.
So kommen wir auf den Faktor \(\frac{n}{n/1}\):
\[\frac{QS}{n} \cdot x = \frac{QS}{n-1}\]
\[x = \frac{QS}{n-1}\cdot \frac{n}{QS}\]
\[x=\frac{n}{n-1}\]
Das ist der Faktor, mit dem man die Varianz \(\frac{QS}{n}\) multiplizieren soll, um die Varianz \(\frac{QS}{n-1}\) zu bekommen.
Ein Stichprobenkennwert heißt konsistent, wenn er mit wachsender Stichprobengröße stochastisch gegen den Parameter konvergiert. Mit anderen Worten, die Wahrscheinlichkeit, dass der Stichprobenkennwert beliebig nahe an dem Parameter liegt, strebt für \(n \rightarrow \infty\) gegen 1.
Der Schätzer eines Populationsparameters ist umso effizienter, je kleiner der Standardfehler dieses Schätzers ist.
Ein Schätzer ist suffizient, wenn er alle in der Stichprobe enthaltenen Informationen nutzt.
(3) Intelligenzquotient
Es sei bekannt, dass Intelligenzquotientwerte in der Population normalverteilt sind mit x~N(100,100).
Du ziehst eine Zufallsstichprobe aus N = 25 Psychologiestudierenden und erhältst einen Mittelwert von \(\bar{x}\) = 107 und eine Standardabweichung von \(s\) = 6.
(a) Berechne das 95%-Konfidenzintervall um den Mittelwert.
Als Erstes bestimmen wir die \(z\)-Werte für die Grenzen des 95%-Konfidenzintervalls. Wir brauchen die \(z\)-Werte, die die mittleren 95% der Verteilung eingrenzen:
Wir berechnen den Standardfehler des Mittelwerts:
\[\sigma_{\bar{x}} = \frac{\sigma_x}{\sqrt{n}}= \frac{10}{\sqrt{25}}=2\]
Jetzt können wir schon die Werte in die Formel für die Grenzen des Konfidenzintervalls einsetzen:
(b) Eine andere Forscherin hat in ihrer Studie mit N = 25 Personen ein deutlich breiteres 95%-Konfidenzintervall erhalten. Woran liegt das?
Allgemein kann ein breiteres Konfidenzintervall aus den folgenden drei Gründen entstehen:
In diesem Fall hat die Forscherin eine Stichprobe der gleichen Größe \(n = 25\) und auch gleiches Konfidenzniveau (95%-KI). Deswegen muss es an einer größeren Streuung in ihrer Stichprobe (wenn wir davon ausgehen, dass diese der gleichen Population entnommen wurde) gelegen haben.
(c) Was würde passieren, wenn man statt N = 25 N = 100 Personen untersucht?
Der Standardfehler würde sich verkleinern, da er von der Stichprobengröße anhängig ist: \(\sigma_{\bar{x}} = \frac{\sigma_x}{\sqrt{n}}\).
Das Konfidenzintervall würde deswegen (ceteris paribus = unter sonst gleichen Bedingungen) kleiner werden, d.h. die Schätzung wäre präziser.
(d) Was würde passieren, wenn wir die Irrtumswahrscheinlichkeit von 5% auf 10% setzen?
Das würde einem 90%-Konfidenzintervall entsprechen. Das Konfidenzintervall würde (ceteris paribus) schmaler werden, da wir eine größere Unsicherheit tolerieren. Der zugehörige \(z\)-Wert wäre bei dem 90%-KI mit 1.65 kleiner als bei einer Irrtumswahrscheinlichkeit von 5% (\(z=1.96\)). Dadurch wären die Abweichungen von \(x\) nach unten und oben jeweils kleiner und das KI somit schmaler.
Beschreibe die folgende Abbildung. Gehe dabei auf die folgenden Fragen ein:
Was zeigt sie?Diese Abbildung zeigt 95%-Konfidenzintervalle für die Mittelwerte (“Xbar Values” auf der \(y\) Achse) aus 100 Zufallsstichproben der Größe \(n=60\).
Der wahre Parameter ist als horizontale rote Linie dargestellt und liegt bei ca. 2.3.
Ja, die Breite der Konfidenzintervalle ist immer die gleiche. Das hängt mit der Sicherheit von 95% zusammen, die in diesem Fall festgelegt wurde und auch mit der Tatsache, dass wir Stichproben der gleichen Größe ziehen.
Das sind die Konfidenzintervalle, die den wahren Parameter nicht umschließen: sie liegen entweder vollständig über der roten horizontalen Linie oder vollständig unter dieser Linie. Es gibt genau 5 solche Konfidenzintervalle aus 100. Dies veranschaulicht die Idee eines 95%-Konfidenzintervalls: wenn wir immer wieder Stichproben aus der Population ziehen und die Konfidenzintervalle um die Stichprobenmittelwerte berechnen, werden 5% dieser Konfidenzintervalle auf lange Sicht den Populationsparameter nicht umschließen.
(5) inhaltliche Interpretation
Dein Kollege hat in der Publikation seiner Studie vorbildhaft das KI angegeben und folgende Interpretation dazu geschrieben:
„There is a 95% chance that the true population mean falls within the interval from 1.7 to 3.8.“
Was ist an dieser Interpretation problematisch? Begründe kurz.
Ein Populationsparameter (in diesem Fall der Erwartungswert) ist immer ein fester Wert. Deswegen ist es falsch zu sagen, dass er mit einer bestimmten Wahrscheinlichkeit innerhalb eines Konfidenzintervalls liegt.
Die richtige Interpretation wäre die folgende: wenn wir immer wieder neue Stichproben aus der gegebenen Population ziehen, Mittelwerte berechnen und um diese Mittelwerte 95%-Konfidenzintervalle berechnen, werden 95% dieser Konfidenzintervalle den Erwartungswert umschließen.