Kodierungsarten

Zur Vorhersage von Depressivität ($y$) nach einer bestimmten Behandlung soll eine multiple lineare Regression durchgeführt werden. Insgesamt neun Personen werden in zwei Treatment-Gruppen $a_1$ und $a_2$ sowie einer Kontrollgruppe $a_3$ (= Referenzgruppe) untersucht. Durch Kodierung sollen nun zwei Indikatorvariablen erstellt werden, um das Kriterium $y$ vorherzusagen. In der nachfolgenden Tabelle ist abgebildet, welche Personen (ID) welche Behandlungsform bekamen und welchen Depressivitätswert sie nach der Behandlung hatten:

		Dummy-	Kodierung	Effekt-	Kodierung	Kontrast-	Kodierung
ID	Behandlung	$x_1$	$x_2$	$x_1$	$x_2$	$x_1$	$x_2$	Depressivität
1	$a_1$							4
2	$a_1$							5
3	$a_1$							6
4	$a_2$							11
5	$a_2$							12
6	$a_2$							13
7	$a_3$							15
8	$a_3$							16
9	$a_3$							17

(a) Ergänze die fehlenden Werte für die Indikatorvariablen $x_1$ und $x_2$ in der obenstehenden Tabelle. Führe dazu einmal eine Dummy- und danach eine Effekt-Kodierung durch.

Lösung

		Dummy-	Kodierung	Effekt-	Kodierung	Kontrast-	Kodierung
ID	Behandlung	$x_1$	$x_2$	$x_1$	$x_2$	$x_1$	$x_2$	Depressivität
1	$a_1$	1	0	1	0			4
2	$a_1$	1	0	1	0			5
3	$a_1$	1	0	1	0			6
4	$a_2$	0	1	0	1			11
5	$a_2$	0	1	0	1			12
6	$a_2$	0	1	0	1			13
7	$a_3$	0	0	-1	-1			15
8	$a_3$	0	0	-1	-1			16
9	$a_3$	0	0	-1	-1			17

Dummy-Kodierung:

Zur Kodierung der $k = 3$ Merkmale benötigen wir $k-1 = 2$ Dummy Variablen.
Mit Hilfe von der Dummy-Variable $x_1$ kodieren wir die Zugehörigkeit zur Gruppe $a_1$ mit $1$ und den Rest mit $0$.
Mit Hilfe von $x_2$ kodieren wir die Zugehörigkeit zur Gruppe $a_2$ mit $1$ und den Rest mit $0$.
In der Aufgabenstellung wurde $a_3$ als Referenzgruppe definiert. Für die Dummy-Kodierung heißt das, dass diese Gruppe durchgehend mit $0$ kodiert wird.

Effekt-Kodierung:

Die Effekt Kodierung erfolgt analog, nur die Referenzgruppe wird jetzt durchgehend mit $-1$ kodiert:
- Mit Hilfe von der Dummy-Variable $x_1$ kodieren wir die Zugehörigkeit zur Gruppe $a_1$ mit $1$, die Zugehörigkeit zur Gruppe $a_3$ mit $-1$ und den Rest mit $0$.
- Mit Hilfe von $x_2$ kodieren wir die Zugehörigkeit zur Gruppe $a_2$ mit $1$, die Zugehörigkeit zur Gruppe $a_3$ mit $-1$ und den Rest mit $0$.

Anmerkung: Wir brauchen zur Kodierung immer nur $k-1$ Indikatiorvariablen, da wir die Zugehörigkeit zu $k$ Gruppen immer eindeutig kodieren können, wenn wir eine von diesen Gruppen durchgehend mit $0$ bzw. mit $-1$ kodieren. Dies reicht uns aus: Eine eigene Indikatorvariable für diese, als Referenzgruppe bezeichnete, Gruppe zu erstellen, wäre überflüssig.

(b) Wie lauten die unstandardisierten Regressionsgleichungen zur Vorhersage von $y$ in diesen beiden Fällen? Wie interpretiert man dabei die Regressionskonstante und die Regressionsgewichte?

Lösung

Dummy-Kodierung:

Zuerst wollen wir die durchschnittlichen Merkmalsausprägungen (also, die durchschnittlichen Werte der Depressivität $y$) in jeder Gruppe berechnen:
- Gruppe $a_1$: $\bar{y}_1 = \frac{4+5+6}{3}=5$
- Gruppe $a_2$: $\bar{y}_2 = \frac{11+12+13}{3}=12$
- Referenzgruppe $a_3$: $\bar{y}_3 = \frac{15+16+17}{3}=16$
In einer Regressionsgleichung mit dummykodierten Indikatorvariablen entspricht die Regressionskonstante $a$ der durchschnittlichen Merkmalsausprägung in der Referenzgruppe (durchgängig mit $0$ kodiert): $a = \bar{y}_3=16$
Ein $b_i$ Gewicht berechnet sich als Differenz der Mittelwerte für die $i$-te Gruppe und der Referenzgruppe:
- $b_1 = \bar{y}_1 - a = 5-16 = -11$
- $b_2 = \bar{y}_2 - a = 12-16 = -4$
Somit ergibt sich die folgende unstandardisierte Regressionsgleichung:

\[\underline{\underline{\hat{y}_m = 16-11\cdot x_{1m} - 4\cdot x_{2m}}}\]

Interpretation: die durchschnittliche Ausprägung der Depressivität in der Kontrollgruppe (Referenzgruppe) beträgt $16$. Der Durchschnitt der ersten Treatmentgruppe ($x_{1m}$) ist um $11$ Depressivitätspunkte niedriger als der Durchschnitt der Kontrollgruppe. Der Durchschnitt der zweiten Treatmentgruppe ($x_{2m}$) ist um $4$ Depressivitätspunkte niedriger als der Durchschnitt der Kontrollgruppe.

Effekt-Kodierung:

In einer Regressionsgleichung mit effektkodierten Indikatorvariablen entspricht die Regressionskonstante dem ungewichteten [gleich gewichteten] Mittelwert der einzelnen Gruppenmittelwerte: $a = \frac{\bar{y}_1 + \bar{y}_2 + \bar{y}_3}{3} = \frac{5+ 12 + 16}{3} = 11$
Für balancierte Designs entspricht dies dem Gesamtmittelwert der abhängigen Variable.
Ein Gewicht $b_i$ bildet die Differenz des $i$-ten Mittelwerts vom Gesamtmittelwert ab:
- $b_1 = \bar{y}_1 - a = 5-11 = -6$
- $b_2 = \bar{y}_2 - a = 12-11 = 1$
Somit ergibt sich die folgende unstandardisierte Regressionsgleichung:

\[\underline{\underline{\hat{y}_m = 11- 6\cdot x_{1m} + 1\cdot x_{2m}}}\]

Interpretation: Die durchschnittliche Depressivität beträgt $11$ Punkte. Die durchschnittliche Depressivität in der ersten Treatmentgruppe ($x_{1m}$) ist um $6$ Punkte niedriger als der Gesamtmittelwert. Die durchschnittliche Depressivität in der zweiten Treatmentgruppe ($x_{2m}$) ist um $1$ Punkt höher als der Gesamtmittelwert.

(c) Ergänze die fehlenden Werte für die Indikatorvariablen $x_1$ und $x_2$ in der obenstehenden Tabelle. Führe dazu je eine Kontrast-Kodierung für folgende Gruppenvergleiche durch:
1) $a_1$ vs. $a_2$ (wird durch die Indikatorvariabkle $x_1$ abgebildet)
2) $a_1$ und $a_2$ vs. $a_3$ (wird durch die Indikatorvariable $x_2$ abegbildet)

Lösung

		Dummy-	Kodierung	Effekt-	Kodierung	Kontrast-	Kodierung
ID	Behandlung	$x_1$	$x_2$	$x_1$	$x_2$	$x_1$	$x_2$	Depressivität
1	$a_1$	1	0	1	0	1	0.5	4
2	$a_1$	1	0	1	0	1	0.5	5
3	$a_1$	1	0	1	0	1	0.5	6
4	$a_2$	0	1	0	1	-1	0.5	11
5	$a_2$	0	1	0	1	-1	0.5	12
6	$a_2$	0	1	0	1	-1	0.5	13
7	$a_3$	0	0	-1	-1	0	-1	15
8	$a_3$	0	0	-1	-1	0	-1	16
9	$a_3$	0	0	-1	-1	0	-1	17

Kontrast-Kodierung: 1) $a_1$ vs. $a_2$

Wir erstellen pro Kontrast jeweils nur eine Indikatorvariable, mit deren Hilfe wir die uns interessierenden Gruppen vergleichen.
In unserem Fall wollen wir die erste Treatmentgruppe $a_1$ gegen die zweite Treatmentgruppe $a_2$ kontrastieren und kodieren deswegen die Zugehörigkeit zu $a_1$ mit $1$ und die Zugehörigkeit zu $a_2$ mit $-1$.
Die Gruppe $a_3$ interessiert uns nicht, deswegen wird sie mit $0$ kodiert.
Die Gewichte, die wir zugewiesen haben, müssen in der Summe $0$ ergeben:

\[\sum_i c_i = 0 \\ = c_1 + c_2 + c_3 + ... + c_8 + c_9 \\ = 1+1+1+(-1)+(-1)+(-1) +0+0+0\]

Anmerkung: Die Wahl der Zahlen für Kontraste ist ziemlich arbiträr. Wir haben jetzt $1$ und $-1$ gewählt, genauso könnte man auch z.B. $2$ und $-2$ wählen. Durch die Wahl von $1$ und $-1$ ergeben sich jedoch Vereinfachungen bei Berechnungen, weswegen wir oft genau diese Zahlen präferieren.

Kontrast-Kodierung: 2) $a_1$ und $a_2$ vs. $a_3$

Hier wollen wir die beiden Treatmentgruppen $a_1$ und $a_2$ mit der Kontrollgruppe $a_3$ vergleichen.
In diesem Fall haben wir zwei Mengen mit $u=2$ Gruppen in Menge $1$ (die beiden Treatmentgruppen) und $v=1$ Gruppen in Menge $2$ (Kontrollgruppe).
Wir können die Kontraste wie folgt bestimmen:
- Menge $1$: $\frac{1}{u} = \frac{1}{2} = 0.5$
- Menge $2$: $-\frac{1}{v} = -\frac{1}{1} = -1$
Die Gewichte, die wir zugewiesen haben, müssen in der Summe wieder $0$ ergeben:

\[\sum_i c_i = 0 \\ = c_1 + c_2 + c_3 + ... + c_8 + c_9 \\ = 0.5+0.5+0.5+0.5+0.5+0.5+(-1)+(-1)+(-1)\]

Dummy- vs. Effekt-Kodierung

Aufgabe 1

Eine Schulpsychologin untersucht, ob die Händigkeit der SchülerInnen (rechts-/links-/beidhändig) einen Einfluss auf ihre Teamfähigkeit in der Klasse hat. Sie nutzt die folgende Dummy-Kodierung für die drei Arten der Händigkeit:

Dann erhebt sie die Teamfähigkeit der SiebtklässlerInnen mithilfe von LehrerInnenurteilen auf einer Skala von 1 bis 10. Die Psychologin wertet die erhobenen Daten mit Hilfe einer multiplen linearen Regression aus und bekommt die folgende Regressionsgleichung:

\[\hat{y}= 7.5 – 0.6\cdot x_1 – 0.09\cdot x_2\]

(a) Welche Aussage(n) ist/sind richtig?

Mit Hilfe der Kodierung kann man ein kategoriales Kriterium in eine lineare Regression aufnehmen.
Die trichotome Variable „Händigkeit“ wird mit Hilfe zweier Dummy-Variablen kodiert, wobei die Variable „Teamfähigkeit“ hier mindestens intervallskaliert sein muss.
Die Schulpsychologin hat hier linkshändige SchülerInnen als Referenzgruppe festgelegt.
Anstelle einer multiplen Regression hätte man diese Forschungsfrage auch mit einer zweifaktoriellen ANOVA (Faktor A: Händigkeit, Faktor B: Teamfähigkeit) überprüfen können.

Lösung

Mit Hilfe der Kodierung kann man ein kategoriales Kriterium in eine lineare Regression aufnehmen.
FALSCH. Die Kodierung ermöglicht die Aufnahme eines kategorialen Prädiktors in die lineare Regression.
Die trichotome Variable „Händigkeit“ wird mit Hilfe zweier Dummy-Variablen kodiert, wobei die Variable „Teamfähigkeit“ hier mindestens intervallskaliert sein muss.
RICHTIG. Man braucht $k-1=3-1=2$ Dummy-Variablen zur Kodierung der $k=3$ Stufen der Variable “Händigkeit”. Die Variable „Teamfähigkeit“ muss hier als intervallskaliert betrachtet werden, da man die punkt-biseriale Korrelation nicht mit einer Variable auf dem Ordinalskalenniveau berechnen kann.
Die Schulpsychologin hat hier linkshändige SchülerInnen als Referenzgruppe festgelegt.
FALSCH. Hier sind rechtshändige SchülerInnen die Referenzgruppe, da sie durchgängig mit 0 kodiert sind.
Anstelle einer multiplen Regression hätte man diese Forschungsfrage auch mit einer zweifaktoriellen ANOVA (Faktor A: Händigkeit, Faktor B: Teamfähigkeit) überprüfen können.
FALSCH. Diese Forschungsfrage hätte zwar tatsächlich auch mit einer ANOVA überprüft werden können, jedoch (in diesem Fall) nur mit einem Faktor. Die Bewertung der Teamfähigkeit ist die abhängige Variable (das Kriterium der linearen Regression), das durch den Faktor (die UV/den Prädiktor) Händigkeit vorhergesagt wird.

(b) Welche deskriptiven Erkenntnisse über die Teamfähigkeit der SchülerInnen in Abhängigkeit der Händigkeit kann man aus der Regressionsgleichung ableiten?

Lösung

Wir schauen uns die Regressionsgleichung an:

\[\hat{y}= 7.5 – 0.6\cdot x_1 – 0.09\cdot x_2\]

bei Dummy-Kodierung entspricht der $y$-Achsenabschnitt $a$ dem Mittelwert der Referenzgruppe. Also haben rechtshändige SchülerInnen ein durchschnittliches Teamfähigkeitsranking von $a=7.5$.
Die partielle Steigung $b_1$ entspricht der Abweichung des Mittelwerts der durch die Variable $x_1$ mit 1 kodierten Gruppe von der Referenzgruppe. Die Dummy-Variable $x_1$ hat die linkshändigen SchülerInnen mit 1 kodiert. Also haben linkshändige SchülerInnen ein durchschnittliches Beliebtheitsranking von $a-b_1=7.5-0.6= 6.9$.
Die partielle Steigung $b_2$ entspricht der Abweichung des Mittelwerts der durch die Variable $x_2$ mit 1 kodierten Gruppe von der Referenzgruppe. Die Dummy-Variable $x_2$ hat die beidhändigen SchülerInnen mit 1 kodiert. Beidhändige SchülerInnen haben also ein durchschnittliches Beliebtheitsranking von $a-b_2=7.5-0.09=7.41$.

Zusammenfassend kann man sagen, dass sich die Beliebtheit der rechts- und beidhändigen SchülerInnen deskriptiv nicht so stark unterscheidet, wobei die linkshändigen SchülerInnen ein bisschen weniger beliebt sind.

Aufgabe 2

Die Schulpsychologin möchte auch wissen, ob die Händigkeit der SiebtklässlerInnen sich auch auf ihre Noten auswirkt. Sie nutzt diesmal eine Effektkodierung:

Nach der Auswertung der Daten mit Hilfe einer multiplen linearen Regression bekommt die Psychologin die folgende Regressionsgleichung:

\[\hat{y}= 2.9 - 0.3\cdot x_1 + 0.1\cdot x_2\]

(a) Welche deskriptiven Erkenntnisse über die Noten der SchülerInnen in Abhängigkeit von der Händigkeit kann man aus der Regressionsgleichung ableiten?

Lösung

Bei der Effekt-Kodierung entspricht die Regressionskonstante $a$ dem ungewichteten [gleich gewichteten] Mittelwert der einzelnen Gruppenmittelwerte. Also ist der gleich gewichtete Notenmittelwert (oder Gesamtmittelwert) der SiebtklässlerInnen $a= 2.9$.
Die partielle Steigung $b_1$ entspricht der Abweichung des Mittelwerts der durch die Variable $x_1$ mit 1 kodierten Gruppe von dem Gesamtmittelwert. Die effektkodierte Variable $x_1$ hat die linkshändigen SchülerInnen mit 1 kodiert. Der Notenmittelwert der Linkshänder ist somit $a-b_1=2.9-0.3=2.6$.
Die partielle Steigung $b_2$ entspricht der Abweichung des Mittelwerts der durch die Variable $x_2$ mit 1 kodierten Gruppe von dem Gesamtmittelwert. Die effektkodierte Variable $x_2$ hat die beidhändigen SchülerInnen mit 1 kodiert. Der Notenmittelwert der beidhändigen Schüler ist also $a-b_2= 2.9+0.1=3.0$.

Man kann sagen, dass die Linkshänder deskriptiv ein bisschen besser als der Durchschnitt sind. Die beidhändigen Schüler sind deskriptiv ein bisschen schlechter als der Durchschnitt.

(b) Welche Aussage(n) ist/sind richtig?

Es ist hier inhaltlich wichtig, welche Gruppe mit -1 kodiert wird.
Für die Referenzgruppe können wir bei der Effektkodierung kein $b$-Gewicht berechnen und können somit erstmal aus der Regressionsgleichung nichts über diese Gruppe erfahren.
Es wäre sinnvoll gewesen, eine dritte Indikatorvariable aufzunehmen, sodass die Effekte von allen drei Ausprägungen der Händigkeit in der Regressionsgleichung abgelesen werden können.
Wenn die oben dargestellte Effektkodierung eine Kontrastkodierung wäre, würden wir mit Hilfe des Kontrasts $x_1$ die Rechtshänder mit den Linkshändern vergleichen.

Lösung

Es ist hier inhaltlich wichtig, welche Gruppe mit -1 kodiert wird.
FALSCH. Es ist bei Effekt-Kodierung grundsätzlich egal, welche Gruppe mit -1 kodiert wird, da wir die Gruppenmittelwerte mit dem Gesamtmittelwert (gleich gewichtetem Mittelwert) vergleichen. Im Gegensatz dazu hängt es bei der Dummy-Kodierung davon ab, mit welcher Gruppe wir die restlichen vergleichen wollen.
Für die Referenzgruppe können wir bei der Effektkodierung kein $b$-Gewicht berechnen und können somit erstmal aus der Regressionsgleichung nichts über diese Gruppe erfahren.
RICHTIG. Steigungsgewichte geben nur die Effekte der anderen Gruppen, nicht aber den der Referenzgruppe an. .
Anmerkung: Auf indirektem Weg ist die Berechnung aber dennoch möglich. Ihr könnt eure Lösungswege gern im Tutorium oder im Forum teilen.
Es wäre sinnvoll gewesen, eine dritte Indikatorvariable aufzunehmen, sodass die Effekte von allen drei Ausprägungen der Händigkeit in der Regressionsgleichung abgelesen werden können.
FALSCH. $k=3$ Faktorausprägungen können durch $k-1=2$$ Indikatorvariablen kodiert werden. Eine weitere Indikatorvariable würde keine weiteren Informationen liefern – und da sie perfekt durch die anderen beiden Indikatorvariablen erklärt werden würde, käme es zu perfekter Multikollinearität.
Wenn die oben dargestellte Effektkodierung eine Kontrastkodierung wäre, würden wir mit Hilfe des Kontrasts $x_1$ die Rechtshänder mit den Linkshändern vergleichen.
RICHTIG. Bei Kontrasten berücksichtigen wir die mit 0 kodierte(n) Gruppe(n) nicht [in diesem Fall ist das die Gruppe der beidhändigen Schüler]. Wir vergleichen die Gruppe(n), die mit einer positiven Zahl kodiert ist/sind, mit der/den Gruppe(n), die mit einer negativen Zahl kodiert ist/sind.

Allgemeines lineares Modell

(a) Bezogen auf die Aufgabe zu Kodierungsarten (Vorhersage von Depressivität nach einer bestimmten Behandlung): Welches statistische Verfahren haben wir bisher verwendet, um ein $p$-fach gestuftes Merkmal als UV in Beziehung zu einer metrischen AV zu setzen? Was verändert sich im Vergleich dazu, wenn wir eine multiple lineare Regression durchführen?

Lösung

Wir haben dafür eine einfaktorielle ANOVA verwendet.
Wir können alternativ die Fragestellung mit einer multiplen linearen Regression auswerten, da die ANOVA als Spezialfall des ALM betrachtet werden kann.
- Dafür müssen wir die $p$ Stufen des Faktors $A$ in $p-1$ Indikatorvariablen umkodieren. Dies haben wir bereits in der Aufgabe zu Kodierungsarten gemacht.
- außerdem ändert sich auch, dass wir eine Regressionsgleichung formulieren und entsprechend auch die Hypothesentestung anpassen. Wir können jetzt einen $F$-Test anwenden, mit dem wir den Determinationskoeffizienten $R^2$ testen (z.B. wenn wir die Varianzaufklärung testen wollen). Oder wir können einen $t$-Test durchführen, mit dem wir die Regressionsgewichte auf Signifikanz testen (es wäre z.B. bei Kontrasten sinnvoll).

(b) Es handelt sich weiterhin um das Beispiel aus der Aufgabenstellung zu den Kodierungsarten (d.h. die Depressionsintervention). Führe den Hypothesentest für $\alpha = 5\%$ zur einfaktoriellen ANOVA im Rahmen des ALM durch! Die beiden Indikatorvariablen klären $40\%$ der Varianz am Kriterium auf: $R_{y, x_1x_2}^2 = 0.40$.

Lösungsansatz

Wir formulieren unsere Fragestellung:
- für die ANOVA: Unterscheiden sich die Stufen des Faktors $A$ voneinander? Klärt der Faktor $A$ signifikant viel Varianz am Kriterium auf?
- für die ANOVA im Rahmend des ALM: Ist der Varianzanteil $R_{y, x_1x_2}^2$, der durch die beiden Indikatorvariablen aufgeklärt wird, signifikant?
… und stellen unsere Hypothesen auf.
Dann überlegen wir, welchen Test wir brauchen, um unsere Frage zu beantworten.

Lösung

Wir wollen testen, ob der Varianzanteil, der durch die beiden Indikatorvariablen aufgeklärt wird, signifikant ist. Wir testen damit den Determinationskoeffizienten auf Signifikanz und stellen folgende Hypothesen auf:
- für die ANOVA:
  $H_0:$ $\mu_1=\mu_2 = \mu_3$
  $H_1:$ $\mu_1 \neq \mu_2 \neq \mu_3$
- für die ANOVA im Rahmen des ALM behalten wir im Hinterkopf, dass wir eigentlich die folgenden Hypothesen testen:
  $H_0:$ $R_{y, x_1x_2}^2=0$
  $H_1:$ $R_{y, x_1x_2}^2 \neq 0$
Wir nehmen dafür die Formel für die Signifikanztestung des Determinationskoeffizienten und setzen die passenden Indizes für den Fall mit zwei Indikatorvariablen ein:

\[F = \frac{R_{y, x_1...x_k}^2 / k}{(1-R_{y, x_1...x_k}^2) /(N-k-1)} = \frac{R_{y, x_1x_2}^2 / k}{(1-R_{y, x_1x_2}^2) /(N-k-1)}\]

In unserem Fall haben wir Anzahl der Messungen in der Stichprobe $N=9$ und Anzahl der Indikatorvariablen $k= p-1 = 3-1 = 2$.
Jetzt können wir die Signifikanztestung durchführen:

\[F = \frac{R_{y, x_1x_2}^2 / k}{(1-R_{y, x_1x_2}^2) /(N-k-1)} = \frac{0.4 / 2}{(1-0.4) /(9-2-1)} = 2\]

Wir vergleichen diesen $F$-Wert mit dem kritischen Wert $F_{k,N-k-1, 95\%}= F_{2, 6, 95\%} =5.1433$.
Unser empirischer $F$-Wert ist kleiner als der kritische Wert. Die Nullhypothese, dass die Indikatorvariablen $x_1$ und $x_2$ (entsprechen dem Faktor $A$ in der ANOVA) keine Varianz an der abhängigen Variablen aufklären, wird beibehalten.
Das bedeutet also, dass die Art der Intervention nicht signifikant Varianz des Depressionsscores aufklären kann. Oder anders gesagt: Ob und welche Intervention man durchführt, scheint für die Höhe der Depressivität keine Rolle zu spielen

(c) Welche Aussage(n) ist/sind richtig bezüglich der Auswertung von zweifaktoriellen Versuchsplänen im Rahmen des ALM?

Für einen zweifaktoriellen Plan mit $p = 4$ und $q = 3$ werden $11$ Indikatorvariablen zur vollständigen Kodierung benötigt.
Die zweifaktorielle Analyse im Rahmen des ALM unterscheidet sich nicht für feste vs. zufällige Effekte.
In unbalancierten Designs sind die Indikatorvariablen, welche Haupteffekte bzw. Interaktionen kodieren, miteinander korreliert.
Die Signifikanztestung können wir separat jeweils für jeden Haupteffekt und für die Interaktion durchführen, wobei wir die gleiche Formel des $F$-Werts verwenden, wie im einfaktoriellen Fall in der Aufgabe (b).

Lösung

Für einen zweifaktoriellen Plan mit $p = 4$ und $q = 3$ werden $11$ Indikatorvariablen zur vollständigen Kodierung benötigt.
RICHTIG.
Bei der einfaktoriellen ANOVA hatten wir nur einen Faktor $A$ und haben $k=p-1$ Indikatorvariablen zur Kodierung gebraucht, wobei $p$ die Anzahl der Faktorstufen von $A$ war.
Bei der zweifaktoriellen ANOVA führen wir die Varianz der AV auf die beiden Haupteffekte, die Interaktion und den Fehlerterm zurück. Zur Kodierung benötigen wir $p-1$ Indikatorvariablen für Faktor $A$, $q-1$ Indikatorvariablen für Faktor $B$ und $(p-1)(q-1)$ Indikatorvariablen für die Interaktion.
Somit können wir ausrechnen, wie viele Indikatorvariablen wir zur Kodierung benötigen:
$k_A = p-1 = 4-1=3$
$k_B = q-1 = 3-1 = 2$
$k_{AB} = (p-1)(q-1) = (4-1)(3-1)= 3 \cdot 2 = 6$
$k_{gesamt} = k_A+k_B+k_{AB} = 3+2+6 = \underline{\underline{11}}$
Die zweifaktorielle Analyse im Rahmen des ALM unterscheidet sich nicht für feste vs. zufällige “Effekte”.
FALSCH. Haben Faktoren zufällige “Effekte”, ändern sich wie zuvor die Prüfvarianzen der Haupteffekte (nicht der Interaktion!): Wir setzen die $MQ_{AB}$ anstelle von $MQ_e$ im Nenner des $F$-Bruchs ein. Im Falle der zweifaktoriellen Analyse mit dem ALM ersetzen wir den Term $(1-R_{y, x_1x_2}^2)$ im Nenner ( = Fehlervarianz) durch $R_{y, x_{AB}}^2$ ( = durch die Interaktion aufgeklärte Varianz). Dabei steht $x_{AB}$ für die Menge der Indikatorvariablen, die die Interaktion kodieren. Entsprechend müssen die Fehlerfreiheitsgrade durch die Freiheitsgrade der Interaktion ersetzt werden.
In unbalancierten Designs sind die Indikatorvariablen, welche Haupteffekte bzw. Interaktionen kodieren, miteinander korreliert.
RICHTIG. Wie wir in der Vorlesung zur mehrfaktoriellen ANOVA gelernt haben, korrelieren die Haupteffekte und die Interaktion in einem unbalancierten Design miteinander. Dies gilt auch in dem Fall, wenn wir die Faktorstufenkombinationen durch die passende Anzahl an Indikatorvariablen kodieren.
Die Signifikanztestung können wir separat jeweils für jeden Haupteffekt und für die Interaktion durchführen, wobei wir die gleiche Formel des $F$-Werts verwenden, wie im einfaktoriellen Fall in der Aufgabe (b).
FALSCH. Im $F$-Bruch setzen wir die durch den jeweiligen Haupteffekt bzw. die Interaktion aufgeklärte Varianz mit der Fehlervarianz, also der Varianz die weder durch die Haupteffekte und die Interaktion aufgeklärt werden kann, ins Verhältnis. Bei einem einfaktoriellen Design wird der $F$-Bruch wie folgt gebildet ($x_A$ ist in diesem Fall stellvertrend für alle Indikatorvariablen, die den Faktor A kodieren): \[F = \frac{R_{y, x_A}^2 / (p - 1)}{(1-R_{y, x_A}^2) /(N-p)}\] Bei einem zweifaktoriellen Design ändert sich hingegen der Nenner des $F$-Bruchs (in diesem Fall für Faktor A) wie hier zu sehen: \[F = \frac{R_{y, x_A}^2 / (p - 1)}{(1-R_{y, x_Ax_Bx_{AB}}^2) /(N-q \cdot p)}\]

(d) Ermittle, wie viele Indikatorvariablen zur Kodierung in folgenden Versuchsplänen benötigt werden.

Zweifaktorieller Plan mit p = 5 und q = 2
Dreifaktorieller Plan mit p = 3, q = 3 und r = 3

Lösung

1) Zweifaktorieller Plan mit p = 5 und q = 2

Wir bestimmen die Anzahl der Indikatorvariablen für jeden Faktor, wie folgt:

Faktor A: $p-1 = 5-1 = 4$
Faktor B: $q-1 = 2-1 = 1$
Interaktion AB: $(p-1)\cdot(q-1) = 4\cdot 1 = 4$
Insgesamt benötigen wir 9 Indikatorvariablen zur Kodierung dieses Designs.

3) Dreifaktorieller Plan mit p = 3, q = 3 und r = 3

Wir bestimmen die Anzahl der Indikatorvariablen für jeden Faktor, wie folgt:

Faktor A: $p-1 = 3-1 = 2$
Faktor B: $q-1 = 3-1 = 2$
Faktor C: $r-1 = 3-1 = 2$
Interaktion AB: $(p-1)\cdot(q-1) = 2\cdot 2 = 4$
Interaktion AC: $(p-1)\cdot(r-1) = 2\cdot 2 = 4$
Interaktion BC: $(q-1)\cdot (r-1) = 2\cdot 2 = 4$
Interaktion ABC: $(p-1)\cdot(q-1)\cdot (r-1) = 2\cdot 2\cdot 2 = 8$
Insgesamt benötigen wir 26 Indikatorvariablen zur Kodierung dieses Designs.

Kodierung und R-Outputs

In einer Studie wurde untersucht, ob sich die Dauer der Fahrpraxis (1: < 5 Jahre; 2: 5-10 Jahre; 3: > 10 Jahre) auf die Reaktionszeit (Zeit bis zum Einleiten des Bremsvorgangs in Sekunden) von Autofahrern auswirkt. Die Forscher haben in R eine einfaktorielle Varianzanalyse im Rahmen des ALM durchgeführt.

Zuerst haben sie eine Dummy-Kodierung verwendet (1. Gruppe als Referenz) und haben den folgenden Output erhalten.

(a) Welche für unsere Forschungsfrage wichtigen Informationen können wir aus dem Output ablesen? Wie lautet die Regressionsgleichung? Was sind die mittleren Reaktionszeiten der drei Gruppen?

Lösung

Generell können wir aus dem Output folgende Werte ablesen:

Dabei liegt unser Fokus erstmal auf der Spalte Estimate, welche die Werte für $y$-Achsenabschnitt $a$ und die beiden partiellen Steigungen $b_1$ und $b_2$ angibt.

Mit diesen Werten können wir die Regressionsgleichung aufstellen:

\[\hat{y} = 1.421+0.037\cdot X_{12} - 0.056 \cdot X_{13}\]

Wir wissen, dass bei Dummy-Kodierung der $y$-Achsenabschnitt der Regression den Mittelwert der Referenzgruppe widerspiegelt. Da hier die 1. Gruppe (<5 Jahre Fahrpraxis) die Referenzgruppe ist, entspricht die mittlere Reaktionszeit der “unerfahrenen” Gruppe $\bar{A}_1=a=1.421$ Sekunden bis zum Einleiten des Bremsvorgangs.
Da uns nichts Weiteres über das Kodierungsschema bekannt ist, nehmen wir an, dass die Variable $X_{12}$ die Zugehörigkeit zur 2. Gruppe (5-10 Jahre Fahrpraxis) mit 1 kodiert. Somit gibt der Steigungskoeffizient $b_1$ die Abweichung des Mittelwerts dieser Gruppe von der Referenzgruppe an. Dann beträgt die mittlere Reaktionszeit der “mittelerfahrenen” Gruppe $\bar{A}_2=a+b_1=1.421+0.037=1.458$ Sekunden bis zum Einleiten des Bremsvorgangs. D.h. diese Gruppe ist ein bisschen langsamer als die “unerfahrene” Gruppe.
Des Weiteren nehmen wir an, dass die Variable $X_{13}$ die Zugehörigkeit zur 3. Gruppe (>10 Jahre Fahrpraxis) mit 1 kodiert. Somit gibt der **Steigungskoeffizient $b_2$* die Abweichung des Mittelwerts dieser Gruppe von der Referenzgruppe an. Dann beträgt die mittlere Reaktionszeit der “erfahrenen” Gruppe $\bar{A}_3=a+b_2=1.421+(-0.056)=1.365$ Sekunden bis zum Einleiten des Bremsvorgangs. D.h. diese Gruppe hat die kürzeste Reaktionszeit.

Danach haben die Forscher eine Effekt-Kodierung verwendet (die 3. Gruppe als Referenz) und haben den folgenden Output erhalten.

(b) Welche für unsere Forschungsfrage wichtigen Informationen können wir aus dem Output ablesen? Wie lautet die Regressionsgleichung? Stimmen die mittleren Reaktionszeiten der drei Gruppen (bzw. der Gruppen, die wir ablesen können) mit den mittleren Reaktionszeiten aus a) überein?

Hinweis zum Kodierungsschema: hier wurde die 3. Gruppe mit -1 kodiert.

Lösung

Aus dem Output der linearen Regression mit Effekt-Kodierung können wir folgende Informationen ablesen:

Die Regressionsgleichung lautet dann wie folgt:

\[\hat{y}=1.415+0.006\cdot X_{21}+0.043\cdot X_{22}\]

Da die 3. Gruppe (>10 Jahre Fahrpraxis) mit -1 kodiert wurde, kommt in dem R-Output kein Wert vor, der direkt damit verbunden ist. Also können wir den Mittelwert der 3. Gruppe aus a) auch nicht auf Übereinstimmung prüfen.
Wir nehmen an, der Steigungskoeffizient $b_1$ gibt die Abweichung des Mittelwerts der 1. Gruppe vom Gesamtmittelwert (bzw. dem gleich gewichteten Mittelwert der Gruppen) an, da wir nichts Spezifischeres über das Kodierungsschema wissen. Somit beträgt die mittlere Reaktionszeit der “unerfahrenen” Gruppe $\bar{A}_1= a+b_1= \bar{G}+b_1= 1.415+0.006=1.421$ Sekunden. Dies entspricht genau dem Wert, den wir bei Dummy-kodierten Variablen hatten.
Der Steigungskoeffizient $b_2$ gibt die Abweichung des Mittelwerts der 2. Gruppe vom Gesamtmittelwert (bzw. dem gleich gewichteten Mittelwert der Gruppen) an. Somit beträgt die mittlere Reaktionszeit der “mittelerfahrenen” Gruppe $\bar{A}_2= a+b_2= \bar{G}+b_2= 1.415+0.043=1.458$ Sekunden. Dies entspricht auch genau dem Wert, den wir bei Dummy-kodierten Variablen hatten.

Also, ergeben sich bei Dummy- und Effekt-Kodierung die gleichen Gruppenmittelwerte.

(c) Unterscheidet sich die Höhe der aufgeklärten Varianz in beiden Fällen?

Lösung

Den Anteil der aufgeklärten Varianz in einer Regression gibt der Determinationskoeffizient an. In den Lösungen zu a) und b) wurde dieser jeweils im unteren Teil des Outputs markiert. In beiden Fällen beträgt $R^2=0.093$.

Der Anteil der aufgeklärten Varianz ist unabhängig von der Kodierungsart bei einer vollständigen Kodierung.

Eine andere Forschergruppe rechnet die Ergebnisse der Studie mit Hilfe der ANOVA nach. Folgender Output ergibt sich:

(d) Vergleiche diesen Output mit den beiden Outputs der multiplen linearen Regression von oben und entscheide, welche Aussage richtig ist.

Der $F$-Wert im ANOVA-Output gehört zu der Testung des Anteils der aufgeklärten Varianz durch den Faktor $X_1$ (3 Gruppen der Fahrpraxis).
Die Testung des Anteils der aufgeklärten Varianz aus dem ANOVA-Output weicht von der Testung des Determinationskoeffizienten im Rahmen der multiplen linearen Regression ab.
Der kritische Wert, mit dem man den empirischen $F$-Wert vergleichen sollte, unterscheidet sich in den Outputs der ANOVA und multiplen linearen Regression.
Die Stichprobengröße beträgt in beiden Fällen (ANOVA und multiple lineare Regression) 58 Personen.

Lösung

Der $F$-Wert im ANOVA-Output gehört zu der Testung des Anteils der aufgeklärten Varianz durch den Faktor $X_1$ (3 Gruppen der Fahrpraxis).
RICHTIG. Im Rahmen der einfaktoriellen ANOVA wird hier getestet, ob die Zugehörigkeit zu den drei Fahrpraxis-Gruppen (Faktor $X_1$) signifikant viel Varianz des Kriteriums Reaktionszeit aufklärt.
Die Testung des Anteils der aufgeklärten Varianz aus dem ANOVA-Output weicht von der Testung des Determinationskoeffizienten im Rahmen der multiplen linearen Regression ab.
FALSCH. Am Beispiel des Dummy-kodierten Regressions-Outputs: Die beiden Tests testen das Gleiche - ob der Varianzanteil des Kriteriums, der durch den Faktor $X_1$ bzw. durch die Dummy-kodierten Prädiktoren $X_{12}$ und $X_{13}$ aufgeklärt wird, signifikant von 0 unterschiedlich ist. Der empirische $F$-Wert ist in beiden Fällen der gleiche: $F_{emp}=2.909$.
Der kritische Wert, mit dem man den empirischen $F$-Wert vergleichen sollte, unterscheidet sich in den Outputs der ANOVA und multiplen linearen Regression.
FALSCH. In beiden Fällen haben wir dieselben Freiheitgrade: $df_{Zähler}=2$, $df_{Nenner}=57$.
Die Stichprobengröße beträgt in beiden Fällen (ANOVA und multiple lineare Regression) 58 Personen.
FALSCH. Die Stichprobengröße können wir mit Hilfe der Nennerfreiheitsgrade bestimmen, da diese bei multipler linearen Regression $df_{Nenner}=n-k-1$ bzw. bei einfaktoriellen ANOVA $df_{Nenner}=n-p$ betragen. Daraus ergibt sich $N=60$.

		Dummy-	Kodierung	Effekt-	Kodierung	Kontrast-	Kodierung
ID	Behandlung	\(x_1\)	\(x_2\)	\(x_1\)	\(x_2\)	\(x_1\)	\(x_2\)	Depressivität
1	\(a_1\)							4
2	\(a_1\)							5
3	\(a_1\)							6
4	\(a_2\)							11
5	\(a_2\)							12
6	\(a_2\)							13
7	\(a_3\)							15
8	\(a_3\)							16
9	\(a_3\)							17

Kodierung und Allgemeines lineares Modell

Kodierungsarten

Dummy- vs. Effekt-Kodierung

Aufgabe 1

Aufgabe 2

Allgemeines lineares Modell

Kodierung und R-Outputs