(1) Unterrichtsmethoden
Vergleiche Übungsblatt z-Test:
Es soll überprüft werden, ob Schüler_innen eine bessere Schulleistung zeigen, wenn man ihnen die Inhalte mit vielfältigen Methoden beibringt (Lernmethode B), anstatt sie frontal zu unterrichten.
Es sei bekannt, dass die Grundgesamtheit der Schüler_innen, welche nach der herkömmlichen Methode von Herrn A. unterrichtet wurden, eine normalverteilte mittlere Leistung von 50 Punkten im Mathematiktest zeigen.
(a) Welches statistische Modell eignet sich in diesem Fall, um die Fragestellung zu überprüfen? Welche Voraussetzungen müssen dafür gegeben sein?
Ein-Stichproben-t-Test
Voraussetzungen:
Statistische \(H_0\):
\(\underline{\mu_0 \geq \mu_B}\) bzw. inhaltlich identisch: \(\underline{\mu_B \leq \mu_0}\)
Statistische \(H_1\):
\(\underline{\mu_B > \mu_0}\) bzw. \(\underline{\mu_0 < \mu_B}\)
Tipp:
Manchmal ist es leichter, zunächst die \(H_1\) zu notieren (hier: Methode B führt zu höheren Ergebnissen im Mathetest als Methode A). Danach kann dann erschöpfend die \(H_0\) definiert werden (hier: sowohl besseres Abschneiden der Gruppe mit Methode A als auch gleiche Ergebnisse).
Es wird eine Zufallsstichprobe von N = 9 europäischen Schüler_innen gezogen, die mit der neuen Methode (B) unterrichtet und anschließend einem Mathematiktest unterzogen wurden.
Der Mittelwert der Punkte dieser Gruppe im Mathematiktest ist \(\bar{x}\) = 60, die Standardabweichung \(s\) = 7.
1. Ermittlung des kritischen Werts \(t_{krit}\):
Wir haben die folgenden Informationen gegeben, auf Grundlage derer wir den kritischen Wert aus der Tabelle ablesen können: \(df = n-1 = 8\); \(\alpha= 0.1\), einseitig
\(\rightarrow t_{krit} = t_{df, 1-\alpha} = t_{8, 0.9}\)
Das entsprechende Perzentil schlagen wir in der Tabelle der t-Verteilung nach. Diese folgt einem anderen Aufbau als die Verteilungstabelle der z-Werte, die wir aus den vorausgegangenen Sitzungen kennen.
In den Zellen stehen die entsprechenden t-Werte, in Abhängigkeit der Freiheitsgrade (in den Zeilen: ‘df’) und der jeweiligen Fläche, die unter dem entsprechenden t-Wert liegen soll: Wir suchen den t-Wert, unter dem 90% einer t-Verteilung mit \(df\)= 8 Freiheitsgraden liegt und finden:
\(t_{8, 0.9} = 1.397\)
2.Berechnung der empirischen Prüfgröße \(t_{emp}\):
Die entsprechende Formel entnehmen wir der Formelsammlung und fügen die bereits gegebenen Kennwerte \(\bar{x}\) = 60, \(\mu_0\) = 50, \(s_x\) = 7 und \(n\) = 9 ein:
\(\begin {aligned} t_{emp} &= \frac{\bar{x} - \mu_o} {\frac{s_x} {\sqrt{n}}} \\ &= \frac{60 - 50} {\frac {7} {\sqrt{9}}} \\\
&= \frac {10} {\frac {7} {3}} \\ &\approx \underline{4.286} \end{aligned}\)
3. Testentscheidung:
\(1.397 < 4.286 \rightarrow \underline{\underline{t_{krit} < t_{emp}}} \rightarrow\) Verwerfung der \(H_0\)
(2) Die Welt ist grau
Du hast gelesen, dass Personen mit nicht korrigierter Sehschwäche weniger Farben sehen. Du fragst Dich, ob es einen Zusammenhang zu Depressionssymptomen gibt. In der Allgemeinbevölkerung seien Depressionswerte normalverteilt mit \(\mu = 5\). Es wird eine Zufallsstichprobe von \(n = 31\) Personen mit nicht-korrigierter Sehschwäche gezogen. Sie weist normalverteilte Depressionswerte mit \(\bar{x} = 5.8\) und \(s = 2.25\) auf.
Prüfe mit einem geeigneten statistischen Verfahren unter Berücksichtigung der entsprechenden Annahmen, ob sich die Depressionswerte der Personen mit nicht-korrigierter Sehschwäche von denen der Allgemeinbevölkerung unterscheiden! Fülle folgende Lücken für \(\alpha = .05\) aus:
\(H_0\): ___________________
\(H_1\): ___________________
kritischer Wert: ___________________
empirische Prüfgröße: ___________________
Testentscheidung: Die Nullhypothese wird ___________________.
möglicher Fehler nach erfolgter Testentscheidung: ___________________
Interpretation:_________________________________________________________.
\(H_0\): \(\boldsymbol{H_0: \mu = \mu_0}\)
\(H_1\): \(\boldsymbol{H_1: \mu \neq \mu_0}\)
kritischer Wert: \(\boldsymbol{t_{30,97.5\%} = \underline{\underline{2.042}}}\) und \(\boldsymbol{t_{30,2.5\%} = \underline{\underline{-2.042}}}\)
empirische Prüfgröße: \(\boldsymbol{t_{30} \approx 2}\)
Testentscheidung: Die Nullhypothese wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler
Interpretation: Es gibt keine Evidenz dafür, dass sich die Depressionswerte von Personen mit nicht-korrigierter Sehschwäche im Mittel von denen der Allgemeinbevölkerung unterscheiden.
(3) Wahr oder falsch?
Welche der folgenden Aussagen ist falsch?
(1) Unterrichtsmethoden (2)
Weil Vertreter_innen der traditionellen Lehrmethode (wie Herr A.) den angeblich bekannten Werten nicht vertrauen, soll neben der vorhandenen Stichprobe für Methode B noch eine weitere Zufallsstichprobe von Schüler_innen, die nach Methode A unterrichtet werden, gezogen werden. Herr A. geht davon aus, dass die vielfältige Lehrmethode zur Ablenkung anregt und den Lernerfolg verringert.
(a) Welches statistische Modell eignet sich in diesem Fall, um die Fragestellung zu überprüfen? Welche Voraussetzungen müssen dafür gegeben sein?
t-Test für unabhängige Stichproben
Vergleichen wir nicht eine einzige Stichprobe mit einer Population, sondern zwei Stichproben miteinander UND sind diese Stichproben unabhängig voneinander, wenden wir den t-Test für unabhängige Stichproben an.
Voraussetzungen:
Hinweis: Herr A. geht davon aus, dass die traditionelle Lehrmethode effektiver ist, also zu besseren Leistungen führt.
Statistische Nullhypothese:
\(\underline{H_0 = \mu_B \geq \mu_A}\) bzw. alternativ \(\underline{\mu_A \leq \mu_B}\)
\(\rightarrow\) es handelt sich also um eine linksseitige Testung.
Statistische Alternativhypothese:
Es handelt sich um voneinander unabhängige Stichproben, da die Leistung eines/einer Schüler_in in Gruppe A keine Informationen über die Leistung eines/einer Schüler_in in Gruppe B liefert. Sie sind somit vollkommen unabhängig voneinander.
Abhängige Stichproben lägen im Fall von Beobachtungspaaren vor. Dies wäre z.B. dann der Fall, wenn jeder/jede Schüler_in zuerst die Lehrmethode A und dann die Lehrmethode B durchlaufen und am Ende der Lehreinheit jeweils einen Mathematiktest ablegen müsste. In diesem Fall wäre jeder Leistung in Gruppe B eine demselben/derselben Schüler_in zugehörige Leistung in Gruppe A zuordenbar. Somit wären die Leistungen in Durchgang A und B beide abhängig von der individuellen Mathematikbegabung des/der Schüler_in und somit auch abhängig voneinander.
Neben der B-Zufallsstichprobe (\(n\) = 9, \(\bar{x}\) = 60, \(s\) = 7) liegt nun eine weitere Zufallsstichprobe von \(n\) = 10 Schüler_innen, die nach Methode A unterrichtet werden, vor (\(\bar{x}\)= 54, \(s\) = 9).
(d) Wie viele Freiheitsgrade hat die zugehörige t-Verteilung? Erkläre, was hinter der Formel steckt.
\(df = n_1 + n_2 - 2 = 9 + 10 - 2 = \underline{\underline{17}}\)
Erklärung:
(e) R-Output
Nach Berechnung eines t-Tests für unabhängige Stichproben mit den Daten aus Teilaufgabe (1) erhältst du folgenden R-Output:
Zu welcher Testentscheidung gelangt man, wenn man den vorliegenden empirischen t-Wert mit dem entsprechenden kritischen Wert vergleicht (linksgerichtet, \(\alpha\) = 0.05)?
Die empirische Prüfgröße können wir dem R-Output entnehmen (\(\underline{t_{emp}= 1.6081}\))
Die kritische Prüfgröße müssen wir in der Tabelle ablesen. Aus dem Output können wir die dazu erforderliche Anzahl an Freiheitsgraden ablesen (\(df = 17\)).
Da wir einseitig mit \(\alpha\) = 0.05 testen, suchen wir in der Spalte 0.95
und der Zeile 17
und lesen den Wert \(1.74\) ab. Da wir linksseitig testen, setzen wir zudem ein negatives Vorzeichen vor diesen Wert.
\(\underline{t_{krit} = - 1.74}\)
Testentscheidung:
\(-1,74 < 1.6081 \rightarrow \underline{\underline{t_{krit} < t_{emp}}} \rightarrow\) Beibehaltung der \(H_0\)
Beachte: Da linksseitig getestet wird, führt \(t_{krit} < t_{emp}\) zur Beibehaltung (und nicht wie bei rechtsseitiger Testung zur Verwerfung) der Nullhypothese.
Interpretation:
Die Untersuchung spricht gegen die Annahme, dass Schüler_innen unter der Lehrmethode A im Mittel bessere mathematische Leistungen erbringen als Schüler unter der Lehrmethode B.
(f) Welch`s t-Test- R Output
Wie sich herausgestellt hat, haben Vertreter_innen der traditionellen Unterrichtsmethode die Daten manipuliert.
Aufgrund dieser unsauberen wissenschaftlichen Arbeit soll nun ein unabhängiges Aufsichtsgremium den Fall prüfen. Es wird eine Zufallsstichprobe von N = 9 Schüler_innen gezogen, die nach Methode A unterrichtet wurden. Es stellt sich jedoch heraus, dass die Varianzen der neuen Stichproben nicht homogen sind. Aufgrund dessen wird Welch`s t-Test durchgeführt (\(\alpha = 0.10\)). Das Gremium entschließt sich unvoreingenommen an die Testung heranzugehen und testet daher zweiseitig. Folgender R-Output ergibt sich: