\(\chi^{2}\)-Methoden

\(\chi^{2}\)-Unabhängigkeitstest

Wir interessieren uns dafür, ob Blutgruppe und Interesse an Psychologie voneinander abhängig sind. Dafür haben wir einen \(\chi^{2}\)-Unabhängigkeitstest mit \(\alpha = .05\) durchgeführt.
Folgender R-Output ist gegeben:

## 
##  Pearson's Chi-squared test
## 
## data:  Blutgr_psycholog_Interesse
## X-squared = 0.047863, df = 1, p-value = 0.8268

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Anzahl und Interpretation der Freiheitsgrade: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________


Lösung

\(\boldsymbol{H_{0}}\): Blutgruppe und Interesse an Psychologie sind voneinander unabhängig
\(\boldsymbol{H_{1}}\): Blutgruppe und Interesse an Psychologie sind abhängig voneinander
Prüfgröße: \(\chi^{2}(1) = 0.047863\)
Anzahl und Interpretation der Freiheitsgrade: Anzahl der getesteten Merkmale - 1
Testentscheidung: Die \(H_0\) wird beibehalten
möglicher Fehler nach erfolgter Testentscheidung: \(\beta\)-Fehler


Eindimensionaler \(\chi^{2}\)-Test

Entspricht das anteilige Einkommen der drei Geschlechter ihrer Verteilung in der Bevölkerung?
Interpretiere folgenden R-Output für \(\alpha = .05\)!

## 
##  Chi-squared test for given probabilities
## 
## data:  Geschlecht
## X-squared = 6.0992, df = 2, p-value = 0.04738

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Anzahl und Interpretation der Freiheitsgrade: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________


Lösung

\(\boldsymbol{H_{0}}\): Das anteilige Einkommen der drei Geschlechter entspricht ihrer Verteilung in der Bevölkerung.
\(\boldsymbol{H_{1}}\): Das anteilige Einkommen der drei Geschlechter entspricht nicht ihrer Verteilung in der Bevölkerung.
Prüfgröße: \(\chi^{2}(2) = 6.0992\)
Anzahl und Interpretation der Freiheitsgrade: Anzahl der Merkmalstufen - 1 \(\rightarrow\) Es werden drei Geschlechter getestet.
Testentscheidung: Die \(H_0\) wird verworfen
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler


Korrelationen

In einer Studie werden die Korrelationen zwischen den Big Five Domänen angeschaut. Folgender Output ergibt sich für die Testung (\(\alpha=0.05\)), ob der Zusammenhang zwischen Gewissenhaftigkeit und Verträglichkeit existiert:

## 
##  Pearson's product-moment correlation
## 
## data:  B5$vertraeglichkeit and B5$gewissenhaftigkeit
## t = 3.4143, df = 162, p-value = 0.0008079
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.1102224 0.3965981
## sample estimates:
##       cor 
## 0.2590957

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

\(H_{0}\): die untersuchte Korrelation unterscheidet sich nicht von \(0\): \(\rho = 0\)
\(H_{1}\): die untersuchte Korrelation unterscheidet sich von \(0\): \(\rho \neq 0\)
Prüfgröße: \(t_{162}= 3.4143\)
Aussage der Freiheitsgrade: Stichprobengröße (164) - 2 = 162
p-Wert: \(p= 0.0008079\)
Testentscheidung: Die \(H_0\) wird verworfen.
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler.
Interpretation der Testentscheidung: Zwischen Gewissehaftigkeit und Verträglichkeit gibt es keine Korrelation in der untersuchten Population.


In derselben Studie will man herausfinden, ob sich die Korrelation von Gewissenhaftigkeit mit Verträglichkeit zwischen den Geschlechtern unterscheidet (\(\alpha=0.05\)):

## Correlation tests 
## Call:r.test(n = table(B5$geschlecht)["weiblich"], r12 = cor.w, r34 = cor.m, 
##     n2 = table(B5$geschlecht)["männlich"])
## Test of difference between two independent correlations 
##  z value 0.64    with probability  0.52

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

\(H_{0}\): die beiden Korrelationen unterscheiden sich nicht: \(\rho_1 = \rho_2\)
\(H_{1}\): die beiden Korrelationen unterscheiden sich: \(\rho_1 \neq \rho_2\)
Prüfgröße: \(z=0.64\)
p-Wert: \(p=0.52\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler.
Interpretation der Testentscheidung: Es gibt in der Population keinen Unterschied zwischen den beiden Geschlechtern, was die Größe der Korrelation zwischen Verträglichkeit und Gewissenhaftigkeit angeht.


Einfaktorielle ANOVA

Es werden folgende Kontrollüberzeugungen unterschieden: Powerful others, internale Kontrollüberzeugung sowie Glaube in Schicksal, Gott oder Zufall. In einer einfaktoriellen Varianzanalyse wurde getestet, ob es Varianzunterschiede im akademischen Erfolg gibt, die durch die unterschiedlichen Kontrollüberzeugungen erklärt werden können (\(\alpha = .05\)).
Folgender R-Output ist gegeben:

##                     Df Sum Sq Mean Sq F value  Pr(>F)   
## Kontrollüberzeugung  2   47.4  23.700    8.11 0.00174 **
## Residuals           27   78.9   2.922                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Anzahl und Interpretation der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

\(\boldsymbol{H_{0}}\): \(\mu_{1} = \mu_{2} = \mu_{3}\)
\(\boldsymbol{H_{1}}\): \(\mu_{i} \neq \mu_{j}\)
Prüfgröße: \(F = 8.11\; mit \;df_{1} = 2,\; df_{2} = 27\)
Anzahl und Interpretation der Freiheitsgrade: \(df_{1}:\) Anzahl der Faktorstufen (3) - 1 = 2; \(df_{2}:\) Stichprobengröße (30) - Anzahl der Faktorstufen (3) = 27
p-Wert: 0.00174
Testentscheidung: Die \(H_0\) wird verworfen.
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler
Interpretation der Testentscheidung: Im Mittel unterscheidet sich der akademische Erfolg in Abhängigkeit von der Kontrollüberzeugung (powerful others/internal/Schicksal, Gott, Zufall) in der Population.


Da wir prüfen möchten, ob die Voraussetzungen für eine ANOVA gegeben sind, haben wir einen Levene-Test für die Prüfung der Homoskedastizitätsannahme mit \(\alpha = .20\) durchgeführt.
Folgender R-Output ist gegeben:

## Levene's Test for Homogeneity of Variance (center = mean)
##       Df F value Pr(>F)
## group  2  0.0996 0.9056
##       27

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Gruppenanzahl: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

\(\boldsymbol{H_{0}}\): \(\sigma^{2}_{1} = \sigma^{2}_{2} = \sigma^{2}_{3}\)
\(\boldsymbol{H_{1}}\): \(\sigma_{i} \neq \sigma_{j}\)
Prüfgröße: \(F = 0.0996\; mit \;df_{1} = 2,\; df_{2} = 27\)
Gruppenanzahl: \(df_{1} = 2 \rightarrow 2 + 1 = 3\)
p-Wert: 0.9056
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\beta\)-Fehler
Interpretation der Testentscheidung: Die Varianzen der akademischen Erfolgswerte unterscheiden sich in der Population nicht zwischen den unterschiedlichen Kontrollüberzeugungen (powerful others/internal/Schicksal, Gott, Zufall).


Da wir prüfen möchten, ob die Voraussetzungen für eine ANOVA gegeben sind, haben wir Shapiro-Wilk-Tests für die Prüfung der Normalverteilungsannahme mit \(\alpha = .15\) durchgeführt.
Folgender R-Output ist gegeben:

## 
##  Shapiro-Wilk normality test
## 
## data:  data$Residuen[data$Kontrollüberzeugung == "powerful others"]
## W = 0.98372, p-value = 0.9819

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

\(\boldsymbol{H_{0}}\): Werte sind normalverteilt
\(\boldsymbol{H_{1}}\): Werte sind nicht normalverteilt
Prüfgröße: \(W = 0.97552\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\beta\)-Fehler
Interpretation der Testentscheidung: Die akademischen Erfolgswerte der Population mit der Kontrollüberzeugung “powerful others” sind normalverteilt.


mehrfaktorielle ANOVA

In einer Studie wird untersucht, ob es Varianzunterschiede in der Symptomatik einer Panikstörung gibt, die durch die Effekte von Geschlecht und von 3 Treatment-Bedingungen (Medikation, Verhaltenstherapie, Kontrollgruppe) erklärt werden können:

##                  Df Sum Sq Mean Sq F value   Pr(>F)    
## treatment         2  253.4   126.7  74.529 5.06e-11 ***
## geschl            1    0.3     0.3   0.176    0.678    
## treatment:geschl  2   54.2    27.1  15.941 3.94e-05 ***
## Residuals        24   40.8     1.7                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________


Lösung

\(H_{0}\):

  • Faktor \(A\) (Treatment): \(\mu_1 = \mu_2 = \mu_3\);
  • Faktor \(B\) (Geschlecht): \(\mu_1 = \mu_2\);
  • Interaktion \(AB\): \(\mu_{ij}-\mu_{i\cdot}-\mu_{\cdot j}+\mu = 0\)

\(H_{1}\):

  • Faktor \(A\) (Treatment): \(\mu_1 \neq \mu_2 \neq \mu_3\);
  • Faktor \(B\) (Geschlecht): \(\mu_1 \neq \mu_2\);
  • Interaktion \(AB\): \(\mu_{ij}-\mu_{i\cdot}-\mu_{\cdot j}+\mu \neq 0\)

Prüfgröße:

  • Faktor \(A\) (Treatment): \(F_{2,24}=74.529\);
  • Faktor \(B\) (Geschlecht): \(F_{1,24}=0.176\);
  • Interaktion \(AB\): \(F_{2,24}=15.941\)

Aussage der Freiheitsgrade:

  • \(df_A\): Anzahl der Faktorstufen des Faktors \(A\) - 1 = \(p-1=3-1=2\);
  • \(df_B\): Anzahl der Faktorstufen des Faktors \(B\) - 1 = \(q-1=2-1=1\);
  • \(df_{AB}\): \((p-1)\cdot(q-1) = 2 \cdot 1 = 2\)
  • \(df_e\): Stichprobengröße (\(N\)) - \(p\cdot q\) = \(30 - 3\cdot 2 = 24\)

p-Wert:

  • Faktor \(A\) (Treatment): \(p=5.06 \cdot 10^{-11}\)
  • Faktor \(B\) (Geschlecht): \(p=0.678\);
  • Interaktion \(AB\): \(p= 3.94\cdot 10 ^{-5}\)

Testentscheidung:

  • Faktor \(A\) (Treatment): Die \(H_0\) wird abgelehnt.
  • Faktor \(B\) (Geschlecht): Die \(H_0\) wird beibehalten.
  • Interaktion \(AB\): Die \(H_0\) wird abgelehnt.

möglicher Fehler nach erfolgter Testentscheidung:

  • Faktor \(A\) (Treatment): \(\alpha\)-Fehler
  • Faktor \(B\) (Geschlecht): \(\beta\)-Fehler
  • Interaktion \(AB\): \(\alpha\)-Fehler


Jetzt werden die Interaktionsplots gezeichnet:

Welche “Effekte” sind interpretierbar? Wie lautet die Interpretation?


Lösung

  • Haupteffekt \(A\)(Treatment) ist interpretierbar, da sich die Linien im Interaktionsplot nicht überschneiden. Im Mittel unterscheidet sich die Symptomatik der Panikstörung in Abhängigkeit von der Treatment-Bedingung (Medikation, Verhaltenstherapie, Kontrollgruppe) in der Population.
  • Haupteffekt \(B\) (Geschlecht): selbst bei Signifikanz nicht interpretierbar, da sich die Linien im Interaktionsplot überschneiden.
  • Interaktion \(AB\): je nachdem, welches Geschlecht die Patienten haben, reagieren sie im Mittel besser auf eine bestimmte Behandlung.


Jetzt interessiert man sich für den prozentualen Anteil der Variation in der abhängigen Variablen (Symptomatik der Panikstörung), der durch die beiden Haupt-“Effekte“ und die Interaktion aufgeklärt wird:

##                        eta.sq eta.sq.part
## treatment        0.7266991683  0.86131883
## geschl           0.0008603384  0.00729927
## treatment:geschl 0.1554344709  0.57052632

Welche Information gewinnen wir aus diesem Output?


Lösung

Anteil der an der abhängigen Variablen aufgeklärten Variation durch:

  • Faktor \(A\) (Treatment): \(\eta^2_A = 0.7266991683\) \(\rightarrow\) Faktor \(A\) klärt ca. \(72.7\%\) der Varianz der aV auf.
  • Faktor \(B\) (Geschlecht): \(\eta^2_B = 0.0008603384\) \(\rightarrow\) Faktor \(B\) klärt ca. \(0.1\%\) der Varianz der aV auf.
  • Interaktion \(AB\): \(\eta^2_{AB}= 0.1554344709\) \(\rightarrow\) Interaktion \(AB\) klärt ca. \(15.5\%\) der Varianz der aV auf.

  • Anmerkung: die Spalte eta.sq.part ist für uns im Rahmen des Moduls Methodenlehre II nicht relevant.


An einer Hochschule wird der Einfluss von Geschlecht und der Zugehörigkeit zu einer von 4 Seminargruppen auf die Zufriedenheit mit dem Studium untersucht.

##                    Df Sum Sq Mean Sq F value   Pr(>F)    
## gruppe              3   2.66  0.8857   2.550   0.0578 .  
## geschlecht          1   0.00  0.0047   0.014   0.9076    
## gruppe:geschlecht   3   7.97  2.6555   7.646 8.45e-05 ***
## Residuals         155  53.83  0.3473                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##                    Df Sum Sq Mean Sq F value   Pr(>F)    
## geschlecht          1   0.04  0.0394   0.113   0.7368    
## gruppe              3   2.62  0.8742   2.517   0.0603 .  
## geschlecht:gruppe   3   7.97  2.6555   7.646 8.45e-05 ***
## Residuals         155  53.83  0.3473                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Vergleiche die beiden Outputs. Worin unterscheiden sie sich und warum?


Lösung

Folgende Unterschiede kann man feststellen:

  • Unterschiedliche Reihenfolge der Faktoren:
    • Output 1: zuerst Faktor \(A\) (Gruppe), dann Faktor \(B\) (Geschlecht)
    • Output 2: zuerst Faktor \(B\) (Geschlecht), dann Faktor \(A\) (Gruppe)
  • Quadratsummen, mittlere Quadrate, \(F\)-Werte und \(p\)-Werte der Faktoren unterscheiden sich in Abhängigkeit davon, in welcher Reihenfolge diese im Output auftauchen.

All dies deutet darauf hin, dass in dieser Aufgabe ein unbalanciertes Design vorliegt. Hier wurde es mit Typ I Quadratsummen gerechnet, da die Reihenfolge, in der die Faktoren in das Modell afgenommen wurden, eine Rolle spielt. Außerdem ist Typ I die default-Einstellung in R.

Inhaltlicher Bezug:

  • 1.Output: Die Nullhypothese, dass keine Unterschiede zwischen den gewichteten Populationsmittelwerten der Zufriedenheit mit dem Studium (\(y\)) zwischen den Seminargruppen (zuerst aufgenommener Faktor) bestehen, wird beibehalten (\(\alpha=0.05\)). Bei der Berechnung der gewichteten Mittelwerte (der Zufriedenheitswerte) wird ignoriert, dass die Studierende unterschiedliches Geschlecht (an zweiter Stelle aufgenommener Faktor) haben.
  • 2.Output: Die Nullhypothese, dass keine Unterschiede zwischen den gewichteten Populationsmittelwerten der Zufriedenheit mit dem Studium (\(y\)) zwischen den Geschlechtern (zuerst aufgenommener Faktor) bestehen, wird beibehalten (\(\alpha=0.05\)). Bei der Berechnung der gewichteten Mittelwerte (der Zufriedenheitswerte) wird ignoriert, dass die Studierende in unterschiedlichen Seminargruppen (an zweiter Stelle aufgenommener Faktor) sind.
  • Die Testentscheidung bzgl. des jeweils an der zweiten Stelle aufgenommenen Faktors ist nicht interpretierbar.
  • Die Interaktion ist in beiden Fällen signifikant auf dem \(5\%\)-Signifikanzniveau. Dies bedeutet, dass je nachdem, welches Geschlecht die Personen in bestimmten Seminargruppen haben, sind sie mehr oder weniger zufrieden mit dem Studium.


ANOVA mit Messwiederholung

Es wurde die Reaktionszeit einer Treatment- und einer Kontrollgruppe (group) verglichen.
Dabei wurde jede Gruppe jeweils unter 3 Bedingungen (unterschiedlichen Flankierreizen, flank) verglichen.

Vervollständige folgende Lücken zum Versuchsaufbau:

Abhängige Variable: ___________
Gruppierungsfaktor A: ___________
Messwiederholungsfaktor B: ___________


Lösung

Es liegen folgende Variablen vor:

Abhängige Variable: Reaktionszeit
Gruppierungsfaktor A: Gruppierung in Treatment- und Kontrollgruppe \(\rightarrow\) between subject
Messwiederholungsfaktor B: Unterschiedliche Bedingungen, die jeder Proband durchläuft \(\rightarrow\) within subject


Folgender Output wird angegeben:

## $ANOVA
##        Effect DFn DFd          SSn       SSd            F            p p<.05
## 1 (Intercept)   1  18 9931196.8132  438.7989 4.073883e+05 1.189834e-40     *
## 2       group   1  18     487.8639  438.7989 2.001270e+01 2.936428e-04     *
## 3       flank   2  36   81933.5426 1220.3700 1.208489e+03 9.976052e-34     *
## 4 group:flank   2  36     548.2483 1220.3700 8.086457e+00 1.257284e-03     *
##         ges
## 1 0.9998330
## 2 0.2272270
## 3 0.9801518
## 4 0.2483664
## 
## $`Mauchly's Test for Sphericity`
##        Effect         W         p p<.05
## 3       flank 0.9247156 0.5141261      
## 4 group:flank 0.9247156 0.5141261      
## 
## $`Sphericity Corrections`
##        Effect       GGe        p[GG] p[GG]<.05     HFe        p[HF] p[HF]<.05
## 3       flank 0.9299865 1.599628e-31         * 1.03282 9.976052e-34         *
## 4 group:flank 0.9299865 1.693610e-03         * 1.03282 1.257284e-03         *

Vervollständige folgende Lücken:

\(df_A\): _______________
\(df_{P(A)}\): _______________  \(df_B\): _______________
\(df_e\): _______________

\(QS_{AB}\): _______________
\(QS_e\): _______________

Empirische Prüfgröße des Gruppierungsfaktors A: _______________
p-Wert des Messwiederholungsfaktors B: _______________ 

Signifikanztestung mit \(\alpha\) = 0.05:
Gruppierungsfaktor B: die \(H_0\) wird _______________
Messwiederholungsfaktor A: die \(H_0\) wird _______________
Interaktion AB: die \(H_0\) wird _______________


Lösung

\(df_A\): 1
\(df_{P(A)}\): 18
\(df_B\): 2
\(df_e\): 36

\(\rightarrow\) In der jeweiligen Zeile des entsprechenden Effekts (group, flank und group:flank) stehen unter DFn die Freiheitsgrade des Effekts, der bei Signifikanztestung im Zähler des F-Bruchs steht und unter DFddie Freiheitsgrade des Effekts, der bei Signifikanztestung im Nenner des F-Bruchs steht.
\(\rightarrow\) Im Beispiel des Gruppierungsfaktors A (group) lautet der F-Bruch \(F= \frac {QS_a} {QS_{P(A)}}\). Somit ist in dieser Zeile DFn = \(df_A\) und DFd = \(df_{P(A)}\).

\(QS_{AB}\): 548.25
\(QS_e\): 1220.37

\(\rightarrow\) Die Quadratsummen folgen hier demselben Prinzip wie die Freiheitsgrade: SSn bezieht sich auf die QS des Effekts, der bei Signifikanztestung im Zähler des F-Bruchs steht und SSd auf die QS des Effekts, der bei Signifikanztestung im Nenner des F-Bruchs steht.

Empirische Prüfgröße des Gruppierungsfaktors A: 2.001270e+01
p-Wert des Messwiederholungsfaktors B: 9.976052e-34 

Signifikanztestung mit \(\alpha\) = 0.05:
Gruppierungsfaktor B: die \(H_0\) wird: verworfen
Messwiederholungsfaktor A: die \(H_0\) wird: verworfen
Interaktion AB: die \(H_0\) wird: verworfen


Voraussetzung zur sinnvollen Interpretation einer ANOVA mit Messwiederholungsfaktor ist die Zirkularität.

Vervollständige die folgenden Lücken mithilfe des oben aufgeführten Outputs der ezANOVA Funktion:

Greenhouse-Geisser-Epsilon \(\hat {\epsilon}\): _____________
Hynh-Feldt-Epsilon \(\tilde {\epsilon}\): _____________

Freiheitsgrade (ggf. nach Korrektur, wenn notwendig):
\(df_A\): __________
\(df_B\):____________
\(df_{AB}\):__________


Lösung

Greenhouse-Geisser-Epsilon \(\hat {\epsilon}\): 0.93
Hynh-Feldt-Epsilon \(\tilde {\epsilon}\): 1.03

Freiheitsgrade (ggf. nach Korrektur, wenn notwendig):
\(df_A\): 1 \(\rightarrow\) bleibt unverändert, da nur B und AB von der Messwiederholung und somit von Zikrularität beeinflusst werden.

\(df_B \rightarrow\) Da der Messwiederholungsfaktor (logischerweise) von der Messwiederholung betroffen ist, müssen dessen Freiheitsgrade korrigiert werden.
Da dsa Greenhouse Geisser-Epsilon \(\hat{\epsilon}\) > 0.75 ist, wird das Hyunh-Feldt Epsilon \(\tilde{\epsilon}\) zur Korrektur herangezogen. In unserem Beispiel ist dieses jedoch größer als Eins (\(\tilde{\epsilon}\) > 1). Dementsprechend ist eine Korrektur der Freiheitsgrade nicht notwendig

\(df_{AB} \rightarrow\) Auch die Freiheitsgrade der Interaktion müssten theoretisch korrigiert werden, da auch die Interaktion von der Messwiederholung betroffen ist.
Da aber \(\tilde{\epsilon}\) > 1 ist, nehmen wir auch hier keine Korrektur vor.


Einfache Lineare Regression

Der Datensatz “women” beinhaltet Angaben zum Körpergewicht weight (in Pfund) und der Körpergröße height (in Inches) von US-amerikanischen Frauen. Basierend auf diesen Daten wurde eine einfache lineare Regression berechnet.
Folgender R-Output ist gegeben:

## 
## Call:
## lm(formula = weight ~ height, data = women, na.action = "na.exclude")
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.7333 -1.1333 -0.3833  0.7417  3.1167 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -87.51667    5.93694  -14.74 1.71e-09 ***
## height        3.45000    0.09114   37.85 1.09e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.525 on 13 degrees of freedom
## Multiple R-squared:  0.991,  Adjusted R-squared:  0.9903 
## F-statistic:  1433 on 1 and 13 DF,  p-value: 1.091e-14

Vervollständige folgende Lücken:

Kriterium (AV): __________________
Prädiktor (UV):__________________
\(H_{0}\): _______________
\(H_{1}\): _______________
unstandardisierte Steigung b: _______________
Interpretation von b: ________________
Prüfgröße: _______________
Stichprobengröße n: _______________
Interpretation des Determinationskoeffizienten \(R^2\): _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

Kriterium (AV): weight (Körpergewicht)
Prädiktor (UV): height (Körpergröße) \(H_{0}\): \(\beta = 0\)
\(H_{1}\): \(\beta \neq 0\)
unstandardisierte Steigung b: 3.45
Interpretation von b: Bei zwei Frauen, die sich in ihrer Körpergröße um 1 Inch unterscheiden, erwarten wir einen Gewichtsunterschied von ca. 3.45 Pfund.
empirische Prüfgröße: \(t= 37.85\)
Stichprobengröße n: \(n = df + 2 = 13 + 2 = 15\)
Interpretation des Determinationskoeffizienten \(R^2\): \(R^2 = 0.991 \rightarrow\) der Anteil der Variation im Körpergewicht, die im linearen Modell durch die Körpergröße vorhergesagt wird, beträgt 99%.
Testentscheidung: Die \(H_0\) wird verworfen
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler (1. Art)
Interpretation der Testentscheidung: Das lineare Modell mit Körpergröße als Prädiktor kann Körpergewicht vorhersagen.



Detaillierte Erklärung des lm Outputs:

Wir können folgende Information aus dem R Output gewinnen:

Im ersten Teil Call finden wir Angaben zur berechneten Formel:

  • die Formel folgt der Logik AV ~ UV

Im zweiten Block werden Informatioen zu den Residuen gegeben.

Im Block darunter finden wir Angaben bezüglich der Regressionskoeffizienten: Die Zeile (Intercept) bezieht sich auf den y-Achsenabschnitt und height auf die Steigung/ das Regressionsgewicht der Regressionsgeraden

  • Estimate gibt die Schätzung des jeweiligen Koeffizienten an.
    • (intercept) bezieht sich auf den Achsenabschnittsparameter
    • darunter folgen die Prädiktoren/ der einzelne Prädiktor
  • Std. Error gibt den Standardfehler des Regressionsgewichts \(s_b\) an. Er quantifiziert die Unsicherheit, mit der die Populationssteigung \(\beta\) durch die Steigung b geschätzt wird
  • t value: empirischer t-Wert bei Signifikanztestung der jeweiligen Regressionskoeffizienten.
    • Pr(>|t|): Angaben zum p-Wert: die Wahrscheinlichkeit, den vorliegenden empirischen t-Wert oder einen extremeren zu beobachten
  • ***: Die Sternchen am Rand geben ggf. an, ab welchem \(\alpha\) Niveau der t-Wert signifikant ist. Die entsprechende Legende findet sich darunter unter Signif. codes
    \(\rightarrow\) diese Angaben beziehen sich auf die Signifikanztestung der Steigungen der einzelnen Prädiktoren

Im letzten Abschnitt des Outputs finden sich folgende Informationen:

  • Residual standard error: Standardschätzfehler \(s_e\)
  • on 13 degrees of freedom: Freiheitsgrade (df); entspricht n-2
  • Multiple R squared: Determinationskoeffizient \(R^2\)
  • Adjusted R-squared: korrigierter Determinationskoeffizient \(R_{korr}^2\)
  • F-statistic bezieht sich auf die Testung des Gesamtmodells mit allen Prädiktoren
    • Angabe der empirischen Prüfgröße F
    • Angabe des p-Werts der empirischen Prüfgröße


Multiple lineare Regression

Wir möchten Lebenszufriedenheit durch Empathie, Verträglichkeit, Neurotizismus und Einsamkeit vorhersagen. Dazu führen wir eine multiple lineare Regression durch und erhalten folgenden R-Output:

Vervollständige folgende Lücken für \(\alpha = .05\):

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Anzahl und Interpretation der Freiheitsgrade: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

\(\boldsymbol{H_{0}}\): \(\rho^2 = 0 \; \beta_{1} = \beta_{2} = \beta_{3} = \beta_{4} =\beta_{5}\)
\(\boldsymbol{H_{1}}\): \(\rho^2 > 0 \; bzw. \; min. \; ein \; \beta_{j} \neq 0\)
Prüfgröße: \(F = 104.5\; mit\; df_{1} = 4,\; df_{2} = 95\)
Anzahl und Interpretation der Freiheitsgrade: \(df_{1}:\) Anzahl der Prädiktoren (5) - 1 = 4; \(df_{2}:\) Stichprobengröße (100) - Anzahl der Prädiktoren (5) = 95
Testentscheidung: Die \(H_0\) wird verworfen.
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler
Interpretation der Testentscheidung: Das Modell mit den Prädiktoren Empathie, Verträglichkeit, Neurotizismus und Einsamkeit kann Lebenszufriedenheit in der Population vorhersagen.


Da wir prüfen möchten, ob die Voraussetzungen für eine multiple lineare Regression gegeben sind, haben wir folgenden Residualplot erstellt:

Sind die Annahmen der Homoskedastizität und der Linearität erfüllt?


Lösung

Beide Annahmen sind in diesem Fall erfüllt.


Kodierung & ALM

An einer Berliner Uni will man herausfinden, ob die Erstsemestler einen lokalen Anstieg in Neurotizismus-Werten erfahren in Abhängigkeit davon, woher sie kommen. Dazu wird der Wohnort vor der Studiumaufnahme erhoben und wie folgt kategorisiert: alte Bundesländer(\(a_1\)), neue Bundesländer (\(a_2\)), Ausland (\(a_3\)), Berlin (\(a_4\)). Nachdem die Herkunft dummykodiert ist (Berlin = Referenzgruppe), führt man eine lineare Regression durch (\(\alpha=0.05\)).

## 
## Call:
## lm(formula = neurotizismus ~ d1 + d2 + d3, data = studis)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -1.500 -0.500  0.000  0.500  1.683 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.50000    0.07716  45.361   <2e-16 ***
## d1           0.05645    0.14926   0.378    0.706    
## d2          -0.18269    0.15943  -1.146    0.254    
## d3          -0.04412    0.18900  -0.233    0.816    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7114 on 155 degrees of freedom
## Multiple R-squared:  0.01148,    Adjusted R-squared:  -0.007649 
## F-statistic: 0.6002 on 3 and 155 DF,  p-value: 0.6158

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

\(H_{0}\):

  • d1: Neurotizismus-Mittelwert der aus alten Bundesländern kommenden Studierenden unterscheidet sich nicht vom Mittelwert der Berliner: \(\mu_{a_1}=\mu_{a_4}\)
  • d2: Neurotizismus-Mittelwert der aus neuen Bundesländern kommenden Studierenden unterscheidet sich nicht vom Mittelwert der Berliner: \(\mu_{a_2}=\mu_{a_4}\)
  • d3: Neurotizismus-Mittelwert der aus dem Ausland kommenden Studierenden unterscheidet sich nicht vom Mittelwert der Berliner: \(\mu_{a_3}=\mu_{a_4}\)
  • \(R^2\): \(\mu_{a_1}= \mu_{a_2}= \mu_{a_3}= \mu_{a_4}\)

\(H_{1}\):

  • d1: Neurotizismus-Mittelwert der aus alten Bundesländern kommenden Studierenden unterscheidet sich vom Mittelwert der Berliner: \(\mu_{a_1} \neq \mu_{a_4}\)
  • d2: Neurotizismus-Mittelwert der aus neuen Bundesländern kommenden Studierenden unterscheidet sich vom Mittelwert der Berliner: \(\mu_{a_2} \neq \mu_{a_4}\)
  • d3: Neurotizismus-Mittelwert der aus dem Ausland kommenden Studierenden unterscheidet sich vom Mittelwert der Berliner: \(\mu_{a_3} \neq \mu_{a_4}\)
  • \(R^2\): \(\mu_{a_1} \neq \mu_{a_2} \neq \mu_{a_3} \neq \mu_{a_4}\)

Prüfgröße:

  • d1: \(t_{155}= 0.378\)
  • d2: \(t_{155}= -1.146\)
  • d3: \(t_{155}= -0.233\)
  • \(R^2\): \(F_{3,155}= 0.6002\)

Aussage der Freiheitsgrade:

  • \(df_1\): Anzahl der (ursprünglichen, in der Aufgabenstellung aufgelisteten) Faktorstufen \(p\) des Faktors -1 = \(4 - 1 = 3\)
    Anmerkung: d.h. \(df_1=k\), wobei \(k\) die Anzahl der dummykodierten Prädiktoren in der Regression ist.
  • \(df_2\): \(N - p= 159 - 4 = 155\)

p-Wert:

  • d1: \(p= 0.706\)
  • d2: \(p=0.254\)
  • d3: \(p= 0.816\)
  • \(R^2\): \(p=0.6158\)

Testentscheidung:

  • d1: Die \(H_0\) wird beibehalten.
  • d2: Die \(H_0\) wird beibehalten.
  • d3: Die \(H_0\) wird beibehalten.
  • \(R^2\): Die \(H_0\) wird beibehalten.

möglicher Fehler nach erfolgter Testentscheidung:

  • d1: \(\alpha\)-Fehler
  • d2: \(\alpha\)-Fehler
  • d3: \(\alpha\)-Fehler
  • \(R^2\): \(\alpha\)-Fehler

Interpretation der Testentscheidung:

  • Es gibt keine Unterschiede in den durchschnittlichen Neurotizismus-Werten zwischen den Studierenden unterschiedlicher Herkunft.
  • \(R^2\): Durch den dummykodierten Faktor “Herkunft” wird keine Variation am Kriterium (Neurotizismus) in der Population der Erstsemestler einer Berliner Uni aufgeklärt.


Zur Vorhersage von Depressivität (\(y\)) nach einer von 3 Behandlungsarten (Verhaltenstherapie (\(a_1\)), Psychoanalyse (\(a_2\)), Medikation (\(a_3\))) soll eine multiple lineare Regression (\(\alpha = 0.05\)) durchgeführt werden. Nun werden zwei effektkodierte Indikatorvariablen erstellt, um das Kriterium \(y\) vorherzusagen. Medikation wurde als Referenzgruppe festgelegt.

## 
## Call:
## lm(formula = Depressivitaet ~ e1 + e2, data = d1)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##     -1     -1      0      1      1 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  11.0000     0.3333  33.000 5.15e-08 ***
## e1           -6.0000     0.4714 -12.728 1.44e-05 ***
## e2            1.0000     0.4714   2.121   0.0781 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1 on 6 degrees of freedom
## Multiple R-squared:  0.9688, Adjusted R-squared:  0.9583 
## F-statistic:    93 on 2 and 6 DF,  p-value: 3.052e-05

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

\(H_{0}\):

  • e1: Deprssivitätsmittelwert der mit der Verhaltenstherapie (\(a_1\)) behandelten Patienten unterscheidet sich nicht vom Gesamtmittelwert: \(\mu_{a_1}=\mu_{gesamt}\)
  • e2: Deprssivitätsmittelwert der mit der Psychoanalyse (\(a_2\)) behandelten Patienten unterscheidet sich nicht vom Gesamtmittelwert: \(\mu_{a_2}=\mu_{gesamt}\)
  • \(R^2\): \(\mu_{gesamt} = \mu_{a_1}= \mu_{a_2}= \mu_{a_3}\)

\(H_{1}\):

  • e1: Deprssivitätsmittelwert der mit der Verhaltenstherapie (\(a_1\)) behandelten Patienten unterscheidet sich vom Gesamtmittelwert: \(\mu_{a_1} \neq \mu_{gesamt}\)
  • e2: Deprssivitätsmittelwert der mit der Psychoanalyse (\(a_2\)) behandelten Patienten unterscheidet sich vom Gesamtmittelwert: \(\mu_{a_2} \neq \mu_{gesamt}\)
  • \(R^2\): \(\mu_{gesamt} \neq \mu_{a_1} \neq \mu_{a_2} \neq \mu_{a_3}\)

Prüfgröße:

  • e1: \(t_{6}= -12.728\)
  • e2: \(t_{6}= 2.121\)
  • \(R^2\): \(F_{2,6}= 93\)

Aussage der Freiheitsgrade:

  • \(df_1\): Anzahl der (ursprünglichen) Faktorstufen \(p\) des Faktors -1 = \(3 - 1 = 2\)
    Anmerkung: d.h. \(df_1=k\), wobei \(k\) die Anzahl der effektkodierten Prädiktoren in der Regression ist.
  • \(df_2\): \(N - p= 9 - 3 = 6\)

p-Wert:

  • e1: \(p= 1.44 \cdot 10^{-5}\)
  • e2: \(p= 0.0781\)
  • \(R^2\): \(p= 3.052 \cdot10^{-5}\)

Testentscheidung:

  • e1: Die \(H_0\) wird verworfen.
  • e2: Die \(H_0\) wird beibehalten
  • \(R^2\): Die \(H_0\) wird verworfen.

möglicher Fehler nach erfolgter Testentscheidung:

  • e1: \(\alpha\)-Fehler
  • e2: \(\beta\)-Fehler
  • \(R^2\): \(\alpha\)-Fehler

Interpretation der Testentscheidung:

  • e1: Die Verhaltenstherapie reduziert die durchschnittliche Depressivität bei Patienten um \(6\) Einheiten im Vergleich zum Gesamtmittelwert der Depressivität.
  • e2: Der Mittelwert der Depressivität bei mit der Psychoanalyse behandelten Patienten unterscheidet sich nicht von dem Gesamtmittelwert.
  • \(R^2\): Durch den Faktor “Behandlungsarten” wird Variation am Kriterium aufgeklärt.


Zur Vorhersage von Einstellung zum Klimawandel (\(y\)) wird die Zugehörigkeit zur Partei \(M\) vs. \(N\) angeschaut. Mit einer kontrastkodierten Indikatorvariable wird eine lineare Regression (\(\alpha=0.05\)) gerechnet.

## 
## Call:
## lm(formula = Einstellung ~ Kontrast, data = d)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.1667 -0.8333  0.0000  0.8333  1.1667 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)   1.0000     0.2838   3.523  0.00551 **
## Kontrast      0.1667     0.2838   0.587  0.57008   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.9832 on 10 degrees of freedom
## Multiple R-squared:  0.03333,    Adjusted R-squared:  -0.06333 
## F-statistic: 0.3448 on 1 and 10 DF,  p-value: 0.5701

Vervollständige folgende Lücken:

\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________


Lösung

\(H_{0}\):

  • Kontrast: Die mittleren Einstellungen der Mitglieder der Parteien \(M\) und \(N\) zum Klimawandel unterscheiden sich nicht: \(\mu_N = \mu_M\)
  • \(R^2\): Durch die Parteizugehörigkeit wird keine systematische Variation der Einstellungen zum Klimawandel aufgeklärt: \(\mu_N = \mu_M\)

\(H_{1}\):

  • Kontrast: Die mittleren Einstellungen der Mitglieder der Parteien \(M\) und \(N\) zum Klimawandel unterscheiden sich : \(\mu_N \neq \mu_M\)
  • \(R^2\): Durch die Parteizugehörigkeit wird systematische Variation der Einstellungen zum Klimawandel aufgeklärt: \(\mu_N \neq \mu_M\)

Prüfgröße:

  • Kontrast: \(t_{10}= 0.587\)
  • \(R^2\): \(F_{1,10}= 0.3448\)

Aussage der Freiheitsgrade:

  • \(df_1\): Anzahl der (ursprünglichen) Faktorstufen \(p\) des Faktors -1 = \(2 - 1 = 1\)
    Anmerkung: d.h. \(df_1=k\), wobei \(k\) die Anzahl der kontrastkodierten Prädiktoren in der Regression ist.
  • \(df_2\): \(N - p= 12 - 2 = 10\)

p-Wert:

  • Kontrast: \(p= 0.57008\)
  • \(R^2\): \(p= 0.5701\)

Testentscheidung:

  • Kontrast: Die \(H_0\) wird beibehalten.
  • \(R^2\): Die \(H_0\) wird beibehalten.

möglicher Fehler nach erfolgter Testentscheidung:

  • Kontrast: \(\alpha\)-Fehler
  • \(R^2\): \(\alpha\)-Fehler

Interpretation der Testentscheidung:

  • Anmerkung: da wir mit Hilfe des Kontrasts lediglich 2 Gruppen getestet haben, entspricht die Testung des Gesamtmodells mit dem \(F\)-Test der Testung mit einem \(t\)-Test für unabhängige Stichproben. Wir haben gesehen, dass unsere beiden Hypothesen eigentlich gleiche Aussage getätigt haben. Die \(p\)-Werte haben sich auch nur geringfügig unterschieden. Allgemein gilt: \(t_{df}^2 = F_{1, df}\). In unserem Fall wird dies für unsere Prüfgrößen erfüllt: \(t_{10}^2 = F_{1, 10} = 0.587^2 = 0.3447\).
  • Damit interpretieren wir die Testenscheidung wie folgt: Die mittleren Einstellungen der Mitglieder der Parteien \(M\) und \(N\) zum Klimawandel unterscheiden sich nicht signifkant. Durch die Parteizugehörigkeit wird keine systematische Variation der Einstellungen zum Klimawandel aufgeklärt.