Einfaktorielle ANOVA mit Messwiederholung

In einer Studie eines Wirtschaftspsychologen müssen drei Versuchspersonen die Kreativität von drei alternativen Werbespots (\(a_1\), \(a_2\), \(a_3\)) auf einer Skala von 1 bis 40 bewerten.
Es ergebenen sich die folgenden Rohwerte:

Werbespot \(a_1\) Werbespot \(a_2\) Werbespot \(a_3\)
\(P_1\) 18 18 30 \(\bar{P_1}\) = 22
\(P_2\) 16 28 34 \(\bar{P_2}\) = 26
\(P_3\) 26 32 32 \(\bar{P_3}\) = 30
\(\bar{A_1}\) = 20 \(\bar{A_2}\) = 26 \(\bar{A_3}\) = 32 \(\bar{G}\) = 26

(a) Stelle die Null- und die Alternativhypothese des Signifikanztests der ANOVA auf.


Lösung

\[H_0: \mu_1 = \mu_2 = \mu_3\] Die \(H_0\) einer ANOVA mit Messwiederholung gleicht im Prinzip der \(H_0\) einer einfaktoriellen ANOVA.
Wir nehmen in unserer Nullhypothese an, dass die Mittelwerte der unterschiedlichen Populationen identisch sind und dass etwaige Mittelwertunterschiede in den Stichproben nur zufällig zustande kamen.

\[H_1: \mu_i \neq \mu_i\] Wenn sich mindestens zwei der Populationsmittelwerte voneinander unterscheiden, verwerfen wir die \(H_0\) und gehen davon aus, dass die deskriptiven Mittelwertunterschiede tatsächliche Unterschiede zwischen den Faktorstufen auf Populationsebene wiederspiegeln.



(b) Bestimme die Ergebnistabelle der Varianzanalyse und teste auf Signifikanz (\(\alpha\) = 0.05).

Quelle QS df MQ F
Zwischen P
Innerhalb A
Fehler

Lösung

Quelle QS df MQ F
Zwischen P 96 2 48
Innerhalb A 216 2 108 6
Fehler 72 4 18

Erklärung der Rechenwege:

1. Berechnung der Quadratsummen:

Insgesamt teilt sich unsere Varianz wie folgt auf: Berechnung von \(QS_A\):

\(\begin{aligned} QS_A &= n \cdot \sum_{i=1}^p (\bar{A_i} - \bar{G})^2 \\ &= 3 \cdot [(20 - 26)^2 + (26-26)^2 + (32-26)^2] \\ &= 3 \cdot [ (-6)^2 + 0 + 6^2] \\ &= 3 \cdot 72 \\ &= \underline{\underline{216}} \end{aligned}\)

Berechnung von \(QS_{zw}\):

\(\begin{aligned} QS_{zw} &= p \cdot \sum_{m=1}^n (\bar{P_m} - \bar{G})^2 \\ &= 3 \cdot [(22-26)^2 + (26-26)^2 + (30-26)^2] \\ &= 3 \cdot [ (-4)^2 + 0 + 4^2] \\ &= 3 \cdot 32 \\ &= \underline{\underline{96}} \end{aligned}\)

Berechnung von \(QS_e\)
Hier gibt es zwei gültige Rechenwege:

\(\underline{Weg 1}\): Anwendung der Formel für \(QS_e\)

\(\begin{aligned} QS_{e} &= \sum_{i=1}^p \sum_{m=1}^n (y_{im}- \bar{A}_i - \bar{P}_m + \bar{G})^2 \\ &= 2^2 + 4^2 + 2^2 + 4^2 + 2^2 + 2^2 + 2^2 + 2^2 + 4^2 \\ &= \underline{\underline{72}} \end{aligned}\)

\(\underline{Weg 2:}\) Ausgehend von der Varianzzerlegung kann die Fehlerquadratsumme auch spezifiziert werden als \(QS_{tot} - QS_A - QS_P\)
Somit müssen wir zuerst \(QS_{tot}\) berechnen:

\(\begin{aligned} QS_{tot} &= \sum_{i=1}^p \sum_{m=1}^n (y_{im} - \bar{G})^2 \\ &= 8^2 + 8^2 + 4^2 + 10^2 + 2^2 + 8^2 + 6^2 + 6^2 \\ &= 384 \end{aligned}\)

Nun können wir \(QS_e\) berechnen:

\(\begin{aligned} QS_{e} &= QS_{tot} - QS_A - QS_P \\ &= 384 - 96 - 216\\ &= \underline{\underline{72}} \end{aligned}\)

2. Berechnung der Freiheitsgrade:

\(\begin{aligned} df_{A} &= p-1 \\ &= 3-1\\ &= \underline{\underline{2}} \end{aligned}\)

\(\begin{aligned} df_{zw} &= n-1 \\ &= 3-1\\ &= \underline{\underline{2}} \end{aligned}\)

\(\begin{aligned} df_{e} &= (n-1) \cdot (p-1) \\ &= 2 \cdot 2\\ &= \underline{\underline{4}} \end{aligned}\)

3. Berechnung der Mittleren Quadrate:

\(\begin{aligned} MQ_{A} &= \frac {QS_A} {df_A} \\ &= \frac {216} {2}\\ &= \underline{\underline{108}} \end{aligned}\)

\(\begin{aligned} MQ_{zw} &= \frac {QS_{zw}} {df_A} \\ &= \frac {96} {2}\\ &= \underline{\underline{48}} \end{aligned}\)

\(\begin{aligned} MQ_{e} &= \frac {QS_e} {df_e} \\ &= \frac {72} {4}\\ &= \underline{\underline{18}} \end{aligned}\)

4. Berechnung der empirischen Prüfgröße

\(\begin{aligned} F_{A} &= \frac {MQ_A} {MQ_e} \\ &= \frac {108} {18}\\ &= \underline{\underline{6}} \end{aligned}\)

5. kritischer F-Wert

\(\begin{aligned} F_{krit} &= F_{df_A; df_e; 1-\alpha} \\ &= F_{2; 4; 95 \%}\\ &= \underline{\underline{6{.}94}} \end{aligned}\)

Testentscheidung

Da der empirische F-Wert kleiner als der kritische F-Wert ist, behalten wir die \(H_0\) bei. Wir gehen somit weiterhin davon aus, dass zwischen den drei Werbespots keine überzufälligen Mittelwertunterschiede bezüglich ihrer Bewertung der Kreativität bestehen.



(c) Welche Fehlerquadratsumme würde man erhalten, wenn man den Versuch mit einer einfaktoriellen ANOVA ohne Messwiederholungen auswerten würde?

(Achtung: Es handelt sich hierbei um eine theoretische Überlegung. Praktisch wäre dies nicht zulässig, da somit die Annahme der unabhängigen Fehlerkomponenten verletzt werden würde.)


Lösung

Würde man den Versuch mit einer einfaktoriellen ANOVA ohne Messwiederholungen durchführen, würde man die entsprechende Formel zur Berechnung der Fehlerquadratsumme anwenden:

\(QS_e = \sum_i \sum_m (y_{im}- \bar{A_{i}})^2\)

Im Falle einer einfaktoriellen ANOVA würden wir nicht die Varianz erfassen, die unabhängig von Faktor A auf die Unterschiede zwischen Personen zurückzuführen ist (also \(QS_{zw}\)).
Diese gesamte Varianz würde dann einfach zur Fehlervarianz gezählt werden.

Die Fehlerquadratsumme bei Durchführung einer einfaktoriellen ANOVA entspräche dann der Fehlerquadratsumme einer ANOVA mit Messwiederholung plus die Varianz, die auf den Personenfaktor zurückgeführt werden kann, die in einer einfaktoriellen ANOVA aber nicht als solche erkannt wird.

In unserem Beispiel betrüge die Fehlerquadratsumme bei Durchführung einer einfaktoriellen ANOVA folglich:

\(\begin{aligned} QS_{e.einfaktoriell} &= QS_{e.messwiederholung} + QS_{zw}\\ &= 72 + 96\\ &= 168 \end{aligned}\)

Beachte: wie bereits oben erwähnt, handelt es sich nur im eine theoretische Überlegung im Kontext dieser Aufgabe.
Würde man tatsächlich den Messwiederholungsfaktor B in diesen vorliegenden Daten einfach nicht beachten, würde man die Annahme der unabhängigen Fehlerkomponenten verletzen.
Diese gilt als verletzt, wenn die Größe eines Residuums von der Größe eines anderen Residuums abhängig ist. In unserem Beispiel bewertet eine Person mehrere Werbespots. Hat diese Person am Tag der Datenerhebung zum Beispiel schlechte Laune, wirkt sich dies auf alle drei Bewertungen dieser Person aus. Diese nicht erklärbare Varianz steckt somit in allen drei Bewertungen, wodurch die Residuen dieser Bewertungen zusammenhängen.
Da wir aber den Messweiderholungsfaktor nicht beachten, interpretieren wir diese Bewertungen als voneinander unabhängige Datenpunkte und registrieren diesen Zusammenhang nicht.
Folglich wäre die Annahme der unabhängigen Residuen verletzt.



(d) Wie verändert sich die \(QS_e\) in einem Versuchsplan mit Messwiederholungen im Vergleich zu einem Versuchsplan ohne Messwiederholungen? Was bedeutet dies für unsere empirische Prüfgröße?


Lösung

Wie in Teilaufgabe c) verdeutlicht, reduzieren wir durch einen Versuchsplan mit Messwiederholungen die Fehlerquadratsumme, da wir nun zusätzlich \(QS_{zw}\) ermitteln können:

\(QS_{e.messwiederholung} = QS_{e.einfaktoriell} - QS_{zw}\)

Dies hat den Vorteil, dass wir i.d.R. mehr Varianz aufklären können.

Beachte: dies bedeutet nicht zwangsläufig, dass automatisch auch die Signifikanztestung schneller signifikant wird.

Was bedeutet das für unsere empirische Prüfgröße?

\(F_{emp}\) ist abhängig von \(MQ_A\) und \(MQ_e\): \(F_{emp} = \frac {MQ_A} {MQ_e}\).
Sinkt \(MQ_e\), so steigt \(F_{emp}\) und somit auch die Wahrscheinlichkeit, dass der Signifikanztest der ANOVA signifikant ausfällt.

Doch obwohl sich die Fehlerquadratsumme reduziert, bedeutet dies noch nicht, dass auch \(MQ_e\) automatisch kleiner wird.
Die \(MQ_e\) wird klein, wenn ihr Nenner (\(df_e\)) im Verhältnis zum Zähler (\(QS_e\)) groß wird.
Auf den ersten Blick könnte man meinen, dass dies durch einen Versuchsplan mit Messwiederholung der Fall sein müsste, denn tatsächlich sinkt \(QS_e\) in einem Versuchsplan mit Messwiederholungen (wie wir gerade besprochen haben).

Allerdings reduzieren sich gleichzeitig mit \(QS_e\) auch die Freiheitsgrade \(df_e\):

  • während bei der einfaktoriellen ANOVA ohne Messwiederholung die Formel zur Berechnung der Fehlerfreiheitsgrade lautet:
    \(df_e = p \cdot (n-1)\)

  • Wird nun bei einer ANOVA mit Messwiederholung zusätzlich ein Freiheitsgrad von der Anzahl der Faktorstufen abgezogen:
    \(df_e = (p-1) \cdot (n-1)\)

\(\rightarrow\) somit verringern sich die \(df_e\) bei einer ANOVA mit Messwiederholung um einen Freiheitsgrad.

Ob die \(MQ_e\) sinkt oder steigt und ob somit die Signifikanz des empirischen F-Werts wahrscheinlicher wird, hängt folglich davon ab, wie stark die \(QS_e\) im Vergleich zu \(df_e\) abnimmt.

Wird viel Personenvarianz aufgeklärt, sinkt die \(QS_e\) deutlich, während \(df_e\) nur einen Freiheitsgrad verliert:

Es kann aber auch passieren, dass durch die zusätzliche Betrachtung der Personenvarianz \(QS_{zw}\) nur ein kleiner Varianzanteil aus der Fehlerquadratsumme wegfällt. Trotzdem würde \(df_e\) einen Freiheitsgrad verlieren.
In diesem Fall könnte es passieren, dass sich \(MQ_e\) nicht verkleinert, sondern sogar ansteigt:

Die Verwendung eines Versuchsplans mit Messwiederholungen ist also v.a. dann sinnvoll, wenn ausreichend große Personeneffekte bestehen, d.h. wenn die Beobachtungen innerhalb der Versuchspersonen stark miteinander korrelieren (Vgl. Vorlesung)



Messwiederholungs- und Gruppierungsfaktor

Ein Pharmakonzern hat drei neue Serontonin-Wiederaufnahme-Hemmer (SSRI) zur Behandlung von depressiven Erkrankungen entwickelt (\(a_1\), \(a_2\), \(a_3\)).

Um deren Wirksamkeit zu vergleichen, werden drei Gruppen à (n = 25) zufällig zugeteilten Versuchspersonen rekrutiert, die jeweils eines der Medikamente über einen Zeitraum von mehreren Wochen testen. Hierzu beantworten sie einen Fragebogen zur Erfassung klinischer Symptome

  • einmal eine Woche vor Beginn der Behandlung (\(b_1\))
  • einmal während der Behandlungszeit (\(b_2\))
  • und einmal eine Woche nach Absetzen des Medikaments (\(b_3\)).

(a) Vervollständige das Schaubild der Varianzzerlegung, indem du die untenstehenden Beschriftungen den korrekten Quadratsummen (I. bis VII.) zuordnest.

a) Unterschiede, die auf die unterschiedlichen Messzeitpunkte zurückgeführt werden können

b) Variation zwischen den Personen

c) Unterschiede, die auf die Faktorstufen des Treatments zurückgeführt werden können

d) Unterschiede, die auf die Interaktion des Treatmentfaktors A und des Messwiederholungsfaktors B zurückzuführen sind

e) Unterschiede, die auf natürliche Unterschiede zwischen Personen innerhalb des Treatmentfaktors A zurückzuführen sind

f) Variationen innerhalb der Personen

g) Unterschiede, die weder auf die Faktorstufen, noch auf Personeneffekte zurückgeführt werden können


Lösung


(b) Vervollständige die Ergebnistabelle.

Quelle QS df MQ F
Medikament (A) 5
Messwiederholungsfaktor (B) 34
Personenunterschiede innerhalb A (P(A)) 52 0.72
Interaktion (AB)
Fehler (e) 160
Gesamt (Tot) 268

Lösung

Quelle QS df MQ F
Medikament (A) 5 2 2.5 3.47
Messwiederholungsfaktor (B) 34 2 17 15.45
Personenunterschiede innerhalb A (P(A)) 52 72 0.72
Interaktion (AB) 17 4 4.25 3.86
Fehler (e) 160 144 1.1
Gesamt (Tot) 268 224

Erklärung der Rechenwege:

1. Berechnung der Quadratsummen:

Hier sind bereits fast alle Quadratsummen gegeben, nur \(QS_{AB}\) fehlt.
Um an diesen Wert zu gelangen, greifen wir auf unser Wissen bezüglich der Varianzzerlegung (Vgl. Teilaufgabe a) zurück:
Da sich die Quadratsummen \(QS_A\), \(QS_B\), \(QS_{P(A)}\),\(QS_{AB}\) und \(QS_e\) zur Gesamtquadratsumme \(QS{tot}\) zusammensetzen, können wir die Summe der uns bekannten Quadratsummen von \(QS_A\), \(QS_B\), \(QS_{P(A)}\) und \(QS_e\) berechnen und diese von \(QS_{tot}\) abziehen:

\(\begin{aligned} QS_{AB} &= QS_{tot}- QS_A + QS_B + QS_{P(A)} + QS_e \\ &= 268 - 5 + 34 + 52 + 160\\ &= \underline{\underline{17}} \end{aligned}\)

2. Berechnung der Freiheitsgrade:
Hier müssen wir für jede einzelnen Freiheitsgrade die jeweiligen Formeln anwenden:

Berechnung von \(df_A\):

\(\begin{aligned} df_{A} &= p -1 \\ &= 3-1 \\ &= \underline{\underline{2}} \end{aligned}\)

Berechnung von \(df_B\):

\(\begin{aligned} df_{B} &= q -1 \\ &= 3-1 \\ &= \underline{\underline{2}} \end{aligned}\)

Berechnung von \(df_{P(A)}\):

\(\begin{aligned} df_{P(A)} &= p \cdot (n -1) \\ &= 3 \cdot (25-1) \\ &= \underline{\underline{72}} \end{aligned}\)

Berechnung von \(df_{AB}\):

\(\begin{aligned} df_{AB} &= (p - 1) \cdot (q -1) \\ &= (3-1) \cdot (3-1) \\ &= \underline{\underline{4}} \end{aligned}\)

Berechnung von \(df_{e}\):

\(\begin{aligned} df_{e} &= p \cdot (q -1) \cdot (n-1) \\ &= 3 \cdot 2 \cdot 24 \\ &= \underline{\underline{144}} \end{aligned}\)

Berechnung von \(df_{tot}\):

\(\begin{aligned} df_{tot} &= p \cdot q \cdot n -1 \\ &= 3 \cdot 3 \cdot 25 - 1\\ &= \underline{\underline{224}} \end{aligned}\)

Wir können unsere Ergebnisse überprüfen, indem wir schauen, ob die Summe aller Freiheitsgrade \(df_{tot}\) ergibt:
\(2 + 2 + 72 + 4 + 144 = 224\)
\(\rightarrow\) die berechneten Freiheitsgrade scheinen korrekt zu sein.

3. Berechnung der mittleren Quadrate:

Berechnung von \(MQ_A\):

\(\begin{aligned} MQ_A &= \frac {QS_A} {df_A} \\ &= \frac {5} {2} \\ &= \underline{\underline{2.5}} \end{aligned}\)

Berechnung von \(MQ_B\):

\(\begin{aligned} MQ_B &= \frac {QS_B} {df_B} \\ &= \frac {34} {2} \\ &= \underline{\underline{17}} \end{aligned}\)

Berechnung von \(MQ_{P(A)}\):

\(\begin{aligned} MQ_{P(A)} &= \frac {QS_{P(A)}} {df_{P(A)}} \\ &= \frac {52} {72} \\ &\approx \underline{\underline{0.72}} \end{aligned}\)

Berechnung von \(MQ_{AB}\):

\(\begin{aligned} MQ_{AB} &= \frac {QS_{AB}} {df_{AB}} \\ &= \frac {17} {4} \\ &= \underline{\underline{4.25}} \end{aligned}\)

Berechnung von \(MQ_e\):

\(\begin{aligned} MQ_A &= \frac {QS_e} {df_e} \\ &= \frac {160} {144} \\ &\approx \underline{\underline{1.1}} \end{aligned}\)

4. Berechnung der empirischen Prüfgrößen

Berechnung von \(F_A\):

\(\begin{aligned} F_A &= \frac {MQ_A} {MQ_{P(A)}} \\ &= \frac {2.5} {0.72} \\ &\approx \underline{\underline{3.47}} \end{aligned}\)

Beachte: nur bei der Berechnung von \(F_A\) gilt der Sonderfall, dass nicht \(MQ_e\), sondern \(MQ_{P(A)}\) im Nenner des F-Bruchs steht!

Berechnung von \(F_B\):

\(\begin{aligned} F_B &= \frac {MQ_B} {MQ_e} \\ &= \frac {17} {1.1} \\ &\approx \underline{\underline{15.45}} \end{aligned}\)

Berechnung von \(F_{AB}\):

\(\begin{aligned} F_{AB} &= \frac {MQ_{AB}} {MQ_e} \\ &= \frac {4.25} {1.1} \\ &\approx \underline{\underline{3.86}} \end{aligned}\)



c) Welche Nenner- und welche Zählerfreiheitsgrade müssten die jeweiligen kritischen F-Werte der Haupteffekte A und B sowie der Interaktion AB haben?

Lösung

Die Zähler- und Nennerfreiheitsgrade der kritischen F-Werte bei Signifikanztestung einer ANOVA beziehen sich immer auf die Freiheitsgrade des Faktors, deren Mittlere Quadrate im Nenner oder im Zähler der empirischen Prüfgröße steht.

Kritischer F-Wert für Faktor A:

Bei der Berechnung der Prüfgröße für Faktor A stehen die mittleren Quadrate des Faktors A im Zähler und die des Faktors P(A) im Nenner.

\(F_A = \frac {MQ_A} {MQ_{P(A)}}\)

Dies wird auf die Nenner- und Zählerfreiheitsgrade des kritischen F-Werts übertragen:

\(\rightarrow F_{krit_A} = F_{df_A, df_{P(A)}, 1-\alpha}\)

In unserem Beispiel lautet der kritische F-Wert des Hauptfaktors A:
\(F_{krit_A} = F_{2, 72, 1-\alpha}\)

Kritischer F-Wert für Faktor B:

Bei der Berechnung der Prüfgröße für Faktor B stehen die mittleren Quadrate des Faktors B im Zähler und die des Fehlers e im Nenner.

\(F_B = \frac {MQ_B} {MQ_e}\)

Dies wird auf die Nenner- und Zählerfreiheitsgrade des kritischen F-Werts übertragen:

\(\rightarrow F_{krit_B} = F_{df_B, df_e, 1-\alpha}\)

In unserem Beispiel lautet der kritische F-Wert des Hauptfaktors A:
\(F_{krit_B} = F_{2, 144, 1-\alpha}\)

Kritischer F-Wert für Interaktion AB:

Bei der Berechnung der Prüfgröße für die Interaktion AB stehen die mittleren Quadrate der Interaktion AB im Zähler und die des Fehlers e im Nenner.

\(F_{AB} = \frac {MQ_{AB}} {MQ_e}\)

Dies wird auf die Nenner- und Zählerfreiheitsgrade des kritischen F-Werts übertragen:

\(\rightarrow F_{krit_AB} = F_{df_{AB}, df_e, 1-\alpha}\)

In unserem Beispiel lautet der kritische F-Wert des Hauptfaktors A:
\(F_{krit_AB} = F_{4, 144, 1-\alpha}\)


Zwei Messwiederholungsfaktoren

Eine Jugend-Handballmannschaft verbringt die Sommerferien gemeinsam in einem Trainingscamp. Der Trainer verspricht sich für seine Mannschaft vor allem Fortschritte hinsichtlich des Sprintens, der Ausdauer und der Wurfpräzision.

Um die Effektivität des Trainingscamps zu testen, erhebt er jeweils vor (\(b_1\)) und nach den Sommerferien (\(b_2\)) die Teamleistung hinsichtlich des Sprintens (\(a_1\)), der Ausdauer (\(a_2\)) und der Wurfpräzision (\(a_3\)) und bewertet sie auf einer Skala von 1-10.

Vervollständige das Schaubild der Varianzzerlegung, indem du die untenstehenden Beschriftungen den korrekten Quadratsummen (I. bis VIIÍ.) zuordnest.

a) Unterschiede, die auf die Interaktion der Mannschaftsmitglieder mit dem Messwiederholungsfaktor B zurückzuführen sind

b) Unterschiede, die auf die unterschiedlichen Messzeitpunkte (vor und nach dem Camp) zurückgeführt werden können

c) Variationen innerhalb der Teammitglieder

d) Unterschiede, die auf die Interkation des Messwiederholungsfaktors mit der einzelnen Leistungsbereichen zurückzuführen sind

e) Unterschiede, die auf die Interaktion der Mannschaftsmitglieder mit dem Faktor A (den unterschiedlichen Leistungsbereichen) zurückzuführen sind

f) Leistingsunterschiede zwischen den Mitgleidern des Teams

g) Unterschiede, die weder auf die Faktorstufen, noch auf Personeneffekte zurückgeführt werden können

h) Unterschiede, die auf die unterschiedlichen Leistungsbereiche (Sprint, Ausdauer, Wurfpräzision) zurückzuführen sind

Lösung