(1) Unterrichtsmethoden
Vergleiche Übungsblatt z-Test:
Es soll überprüft werden, ob Schüler_innen eine bessere Schulleistung zeigen, wenn man ihnen die Inhalte mit vielfältigen Methoden beibringt (Lernmethode B), anstatt sie frontal zu unterrichten.
Es sei bekannt, dass die Grundgesamtheit der Schüler_innen, welche nach der herkömmlichen Methode von Herrn A. unterrichtet wurden, eine normalverteilte mittlere Leistung von 50 Punkten im Mathematiktest zeigen.
(a) Welches statistische Modell eignet sich in diesem Fall, um die Fragestellung zu überprüfen? Welche Voraussetzungen müssen dafür gegeben sein?
Ein-Stichproben-t-Test
Voraussetzungen:
Statistische \(H_0\):
\(\underline{\mu_0 \geq \mu_B}\) bzw. inhaltlich identisch: \(\underline{\mu_B \leq \mu_0}\)
Statistische \(H_1\):
\(\underline{\mu_B > \mu_0}\) bzw. \(\underline{\mu_0 < \mu_B}\)
Tipp:
Manchmal ist es leichter, zunächst die \(H_1\) zu notieren (hier: Methode B führt zu höheren Ergebnissen im Mathetest als Methode A). Danach kann dann erschöpfend die \(H_0\) definiert werden (hier: sowohl besseres Abschneiden der Gruppe mit Methode A als auch gleiche Ergebnisse).
Es wird eine Zufallsstichprobe von N = 9 europäischen Schüler_innen gezogen, die mit der neuen Methode (B) unterrichtet und anschließend einem Mathematiktest unterzogen wurden.
Der Mittelwert der Punkte dieser Gruppe im Mathematiktest ist \(\bar{x}\) = 60, die Standardabweichung \(s\) = 7.
1. Ermittlung des kritischen Werts \(t_{krit}\):
Wir haben die folgenden Informationen gegeben, auf Grundlage derer wir den kritischen Wert aus der Tabelle ablesen können: \(df = n-1 = 8\); \(\alpha= 0.1\), einseitig
\(\rightarrow t_{krit} = t_{df, 1-\alpha} = t_{8, 0.9}\)
Das entsprechende Perzentil schlagen wir in der Tabelle der t-Verteilung nach. Diese folgt einem anderen Aufbau als die Verteilungstabelle der z-Werte, die wir aus den vorausgegangenen Sitzungen kennen.
In den Zellen stehen die entsprechenden t-Werte, in Abhängigkeit der Freiheitsgrade (in den Zeilen: ‘df’) und der jeweiligen Fläche, die unter dem entsprechenden t-Wert liegen soll: Wir suchen den t-Wert, unter dem 90% einer t-Verteilung mit \(df\)= 8 Freiheitsgraden liegt und finden:
\(t_{8, 0.9} = 1.397\)
2.Berechnung der empirischen Prüfgröße \(t_{emp}\):
Die entsprechende Formel entnehmen wir der Formelsammlung und fügen die bereits gegebenen Kennwerte \(\bar{x}\) = 60, \(\mu_0\) = 50, \(s_x\) = 7 und \(n\) = 9 ein:
\(\begin {aligned} t_{emp} &= \frac{\bar{x} - \mu_o} {\frac{s_x} {\sqrt{n}}} \\ &= \frac{60 - 50} {\frac {7} {\sqrt{9}}} \\\
&= \frac {10} {\frac {7} {3}} \\ &\approx \underline{4.286} \end{aligned}\)
3. Testentscheidung:
\(1.397 < 4.286 \rightarrow \underline{\underline{t_{krit} < t_{emp}}} \rightarrow\) Verwerfung der \(H_0\)
(2) Die Welt ist grau
Du hast gelesen, dass Personen mit nicht korrigierter Sehschwäche weniger Farben sehen. Du fragst Dich, ob es einen Zusammenhang zu Depressionssymptomen gibt. In der Allgemeinbevölkerung seien Depressionswerte normalverteilt mit \(\mu = 5\). Es wird eine Zufallsstichprobe von \(n = 31\) Personen mit nicht-korrigierter Sehschwäche gezogen. Sie weist normalverteilte Depressionswerte mit \(\bar{x} = 5.8\) und \(s = 2.25\) auf.
Prüfe mit einem geeigneten statistischen Verfahren unter Berücksichtigung der entsprechenden Annahmen, ob sich die Depressionswerte der Personen mit nicht-korrigierter Sehschwäche von denen der Allgemeinbevölkerung unterscheiden! Fülle folgende Lücken für \(\alpha = .05\) aus:
\(H_0\): ___________________
\(H_1\): ___________________
kritischer Wert: ___________________
empirische Prüfgröße: ___________________
Testentscheidung: Die Nullhypothese wird ___________________.
möglicher Fehler nach erfolgter Testentscheidung: ___________________
Interpretation:_________________________________________________________.
\(H_0\): \(\boldsymbol{H_0: \mu = \mu_0}\)
\(H_1\): \(\boldsymbol{H_1: \mu \neq \mu_0}\)
kritischer Wert: \(\boldsymbol{t_{30,97.5\%} = \underline{\underline{2.042}}}\) und \(\boldsymbol{t_{30,2.5\%} = \underline{\underline{-2.042}}}\)
empirische Prüfgröße: \(\boldsymbol{t_{30} \approx 2}\)
Testentscheidung: Die Nullhypothese wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler
Interpretation: Es gibt keine Evidenz dafür, dass sich die Depressionswerte von Personen mit nicht-korrigierter Sehschwäche im Mittel von denen der Allgemeinbevölkerung unterscheiden.
(3) Wahr oder falsch?
Welche der folgenden Aussagen ist falsch?
(1) Unterrichtsmethoden (2)
Weil Vertreter_innen der traditionellen Lehrmethode (wie Herr A.) den angeblich bekannten Werten nicht vertrauen, soll neben der vorhandenen Stichprobe für Methode B noch eine weitere Zufallsstichprobe von Schüler_innen, die nach Methode A unterrichtet werden, gezogen werden. Herr A. geht davon aus, dass die vielfältige Lehrmethode zur Ablenkung anregt und den Lernerfolg verringert.
(a) Welches statistische Modell eignet sich in diesem Fall, um die Fragestellung zu überprüfen? Welche Voraussetzungen müssen dafür gegeben sein?
t-Test für unabhängige Stichproben
Vergleichen wir nicht eine einzige Stichprobe mit einer Population, sondern zwei Stichproben miteinander UND sind diese Stichproben unabhängig voneinander, wenden wir den t-Test für unabhängige Stichproben an.
Voraussetzungen:
Hinweis: Herr A. geht davon aus, dass die traditionelle Lehrmethode effektiver ist, also zu besseren Leistungen führt.
Statistische Nullhypothese:
\(\underline{H_0 = \mu_B \geq \mu_A}\) bzw. alternativ \(\underline{\mu_A \leq \mu_B}\)
\(\rightarrow\) es handelt sich also um eine linksseitige Testung.
Statistische Alternativhypothese:
Es handelt sich um voneinander unabhängige Stichproben, da die Leistung eines/einer Schüler_in in Gruppe A keine Informationen über die Leistung eines/einer Schüler_in in Gruppe B liefert. Sie sind somit vollkommen unabhängig voneinander.
Abhängige Stichproben lägen im Fall von Beobachtungspaaren vor. Dies wäre z.B. dann der Fall, wenn jeder/jede Schüler_in zuerst die Lehrmethode A und dann die Lehrmethode B durchlaufen und am Ende der Lehreinheit jeweils einen Mathematiktest ablegen müsste. In diesem Fall wäre jeder Leistung in Gruppe B eine demselben/derselben Schüler_in zugehörige Leistung in Gruppe A zuordenbar. Somit wären die Leistungen in Durchgang A und B beide abhängig von der individuellen Mathematikbegabung des/der Schüler_in und somit auch abhängig voneinander.
Neben der B-Zufallsstichprobe (\(n\) = 9, \(\bar{x}\) = 60, \(s\) = 7) liegt nun eine weitere Zufallsstichprobe von \(n\) = 10 Schüler_innen, die nach Methode A unterrichtet werden, vor (\(\bar{x}\)= 54, \(s\) = 9).
(d) Wie viele Freiheitsgrade hat die zugehörige t-Verteilung? Erkläre, was hinter der Formel steckt.
\(df = n_1 + n_2 - 2 = 9 + 10 - 2 = \underline{\underline{17}}\)
Erklärung:
(e) R-Output
Nach Berechnung eines t-Tests für unabhängige Stichproben mit den Daten aus Teilaufgabe (1) erhältst du folgenden R-Output:
Zu welcher Testentscheidung gelangt man, wenn man den vorliegenden empirischen t-Wert mit dem entsprechenden kritischen Wert vergleicht (linksgerichtet, \(\alpha\) = 0.05)?
Die empirische Prüfgröße können wir dem R-Output entnehmen (\(\underline{t_{emp}= 1.6081}\))
Die kritische Prüfgröße müssen wir in der Tabelle ablesen. Aus dem Output können wir die dazu erforderliche Anzahl an Freiheitsgraden ablesen (\(df = 17\)).
Da wir einseitig mit \(\alpha\) = 0.05 testen, suchen wir in der Spalte 0.95
und der Zeile 17
und lesen den Wert \(1.74\) ab. Da wir linksseitig testen, setzen wir zudem ein negatives Vorzeichen vor diesen Wert.
\(\underline{t_{krit} = - 1.74}\)
Testentscheidung:
\(-1,74 < 1.6081 \rightarrow \underline{\underline{t_{krit} < t_{emp}}} \rightarrow\) Beibehaltung der \(H_0\)
Beachte: Da linksseitig getestet wird, führt \(t_{krit} < t_{emp}\) zur Beibehaltung (und nicht wie bei rechtsseitiger Testung zur Verwerfung) der Nullhypothese.
Interpretation:
Die Untersuchung spricht gegen die Annahme, dass Schüler_innen unter der Lehrmethode A im Mittel bessere mathematische Leistungen erbringen als Schüler unter der Lehrmethode B.
(f) Welch`s t-Test- R Output
Wie sich herausgestellt hat, haben Vertreter_innen der traditionellen Unterrichtsmethode die Daten manipuliert.
Aufgrund dieser unsauberen wissenschaftlichen Arbeit soll nun ein unabhängiges Aufsichtsgremium den Fall prüfen. Es wird eine Zufallsstichprobe von N = 9 Schüler_innen gezogen, die nach Methode A unterrichtet wurden. Es stellt sich jedoch heraus, dass die Varianzen der neuen Stichproben nicht homogen sind. Aufgrund dessen wird Welch`s t-Test durchgeführt (\(\alpha = 0.10\)). Das Gremium entschließt sich unvoreingenommen an die Testung heranzugehen und testet daher zweiseitig. Folgender R-Output ergibt sich:
Welche Informationen erhalten wir aus diesem Output? Welche Testentscheidung treffen wir?
Im Allgemeinen lassen sich folgende Informationen aus dem R-Output eines Welch`s t-Test ablesen:
Im Kontext der Aufgabe gewinnen wir folgende Informationen:
Testentscheidung:
Es bieten sich zwei alternative Wege zur Testentscheidung an:
1.Vergleich von \(\alpha\) (0.1) und dem p-Wert (0.01):
\(\alpha\) > p-Wert \(\rightarrow\) Verwerfung der \(H_0\)
2.Vergleich von \(\mu_0\) und den Grenzen des Konfidenzintervalls:
Bei ungerichteter \(H_1\) gilt: Liegt \(\mu_0\) außerhalb der Grenzen des Konfidenzintervalls, wird die \(H_0\) verworfen (Vergleiche Lösung der Aufgabe 1e zum Thema z-Test).
Anhand des Outputs haben wir erkannt, dass die \(H_1\) postuliert, dass der Mittelwertsunterschied ungleich 0 ist \(\rightarrow\) die \(H_0\) postuliert somit, dass der Mittelwertunterscheid gleich null ist: \(\mu_0\) = 0
das KI wurde um den Mittelwertsunterschied der beiden Stichproben gebildet (47-60=-13). Dieses KI vergleichen wir mit dem in der H0 postulierten Unterschied von 0.
Da 0 außerhalb (genauer: oberhalb) der Konfidenzintervallgrenzen von -13.465 und -12.347 liegt, wird die \(H_0\) verworfen.
(2) Straßenlärm & Stress
Du interessierst Dich für den Zusammenhang von Straßenlärm und Stress. Dafür erhebst den Cortisolspiegel 2 Zufallsstichproben von \(n_1 = 31\) Personen, die an einer Hauptstraße wohnen (H), und von \(n_2 = 21\) Personen mit einer ruhigeren Wohnumgebung (R). Der Cortisolspiegel sei in der Population normalverteilt.
(a) Welche Untersuchungsbedingungen solltest Du beachten, da sie die Qualität und den Inhalt Deiner Daten beeinflussen könnten?
Du erhälst Mittelwerte der Cortisolproben in Mikrogramm pro Deciliter Blut von \(\bar{x}_H = 13\) mit \(s_H = 3\) und \(\bar{x}_R = 8\) mit \(s_R = 5\). Unterscheidet sich der mittlere Cortisolspiegel in Abhängigkeit vom Wohnen an einer Hauptstraße?
(b) Stelle die statistischen Hypothesen auf.
\(H_0: \enspace \mu_H = \mu_R\)
\(H_1: \enspace \mu_H \neq \mu_R\)
(c) Teste Deine Hypothesen mit Hilfe eines geeigneten statistischen Verfahrens (\(\alpha = .05\)). Fülle folgende Lücken aus:
kritischer Wert: ___________________
empirische Prüfgröße: ___________________
Testentscheidung: Die Nullhypothese wird ___________________.
möglicher Fehler nach erfolgter Testentscheidung: ___________________
kritischer Wert: \(\boldsymbol{t_{29,97.5\%} = 2.045}\) und \(\boldsymbol{t_{emp} = -2.045}\) mit \(df = 29\)
empirische Prüfgröße: \(\boldsymbol{t_{29} = 3.377}\)
Testentscheidung: Die Nullhypothese wird verworfen.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\alpha}\)-Fehler
Wir verwenden Welch’s t-Test für unabhängige Stichproben mit heterogenen Varianzen, weil wir zwei unabhängige Zufallsstichproben mit unterschiedlichen Varianzen hinsichtlich ihres Mittelwertes in einer hinsichtlich des Merkmals normalverteilten Population vergleichen wollen, um auf einen mittleren Gruppenunterschied in der Population zu testen.
Den kritischen Wert bestimmen wir mit \(\alpha = .05\) für einen ungerichteten Test folgendermaßen:
Die empirische Prüfgröße berechnen wir mit der Formel für Welch’s t-Test:
\(t = \frac{\bar{x}_1 - \bar{x}_2}{s_{\bar{x}_{1}-\bar{x}_{2}}} = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s^2_{x_1}}{n_1}+\frac{s^2_{x_2}}{n_2}}}\)
\(\enspace = \frac{13 - 8}{\sqrt{\frac{3^2}{31}+\frac{5^2}{21}}} \approx \underline{\underline{4.109}}\)
Für die Testentscheidung vergleichen wir den empirischen mit dem kritischen t-Wert: \(|4.109| > | \pm 2.045| \enspace \rightarrow\) Die Nullhypothese wird verworfen.
Es besteht das Risiko eines \(\boldsymbol{\alpha}\)-Fehlers.
(d) Interpretiere Deine Testentscheidung inhaltlich.
Es besteht Evidenz dafür, dass Personen, die an Hauptstraßen wohnen, im Mittel einen höheren Cortisolspiegel haben als Personen in ruhigeren Wohngegenden.