\(\chi^{2}\)-Unabhängigkeitstest
Wir interessieren uns dafür, ob Blutgruppe und Interesse an Psychologie voneinander abhängig sind. Dafür haben wir einen \(\chi^{2}\)-Unabhängigkeitstest mit \(\alpha = .05\) durchgeführt.
Folgender R-Output ist gegeben:
##
## Pearson's Chi-squared test
##
## data: Blutgr_psycholog_Interesse
## X-squared = 0.047863, df = 1, p-value = 0.8268
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Anzahl und Interpretation der Freiheitsgrade: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
\(\boldsymbol{H_{0}}\): Blutgruppe und Interesse an Psychologie sind voneinander unabhängig
\(\boldsymbol{H_{1}}\): Blutgruppe und Interesse an Psychologie sind abhängig voneinander
Prüfgröße: \(\chi^{2}(1) = 0.047863\)
Anzahl und Interpretation der Freiheitsgrade: Anzahl der getesteten Merkmale - 1
Testentscheidung: Die \(H_0\) wird beibehalten
möglicher Fehler nach erfolgter Testentscheidung: \(\beta\)-Fehler
Eindimensionaler \(\chi^{2}\)-Test
Entspricht das anteilige Einkommen der drei Geschlechter ihrer Verteilung in der Bevölkerung?
Interpretiere folgenden R-Output für \(\alpha = .05\)!
##
## Chi-squared test for given probabilities
##
## data: Geschlecht
## X-squared = 6.0992, df = 2, p-value = 0.04738
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Anzahl und Interpretation der Freiheitsgrade: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
\(\boldsymbol{H_{0}}\): Das anteilige Einkommen der drei Geschlechter entspricht ihrer Verteilung in der Bevölkerung.
\(\boldsymbol{H_{1}}\): Das anteilige Einkommen der drei Geschlechter entspricht nicht ihrer Verteilung in der Bevölkerung.
Prüfgröße: \(\chi^{2}(2) = 6.0992\)
Anzahl und Interpretation der Freiheitsgrade: Anzahl der Merkmalstufen - 1 \(\rightarrow\) Es werden drei Geschlechter getestet.
Testentscheidung: Die \(H_0\) wird verworfen
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler
In einer Studie werden die Korrelationen zwischen den Big Five Domänen angeschaut. Folgender Output ergibt sich für die Testung (\(\alpha=0.05\)), ob der Zusammenhang zwischen Gewissenhaftigkeit und Verträglichkeit existiert:
##
## Pearson's product-moment correlation
##
## data: B5$vertraeglichkeit and B5$gewissenhaftigkeit
## t = 3.4143, df = 162, p-value = 0.0008079
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.1102224 0.3965981
## sample estimates:
## cor
## 0.2590957
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
\(H_{0}\): die untersuchte Korrelation unterscheidet sich nicht von \(0\): \(\rho = 0\)
\(H_{1}\): die untersuchte Korrelation unterscheidet sich von \(0\): \(\rho \neq 0\)
Prüfgröße: \(t_{162}= 3.4143\)
Aussage der Freiheitsgrade: Stichprobengröße (164) - 2 = 162
p-Wert: \(p= 0.0008079\)
Testentscheidung: Die \(H_0\) wird verworfen.
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler.
Interpretation der Testentscheidung: Zwischen Gewissehaftigkeit und Verträglichkeit gibt es keine Korrelation in der untersuchten Population.
In derselben Studie will man herausfinden, ob sich die Korrelation von Gewissenhaftigkeit mit Verträglichkeit zwischen den Geschlechtern unterscheidet (\(\alpha=0.05\)):
## Correlation tests
## Call:r.test(n = table(B5$geschlecht)["weiblich"], r12 = cor.w, r34 = cor.m,
## n2 = table(B5$geschlecht)["männlich"])
## Test of difference between two independent correlations
## z value 0.64 with probability 0.52
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
\(H_{0}\): die beiden Korrelationen unterscheiden sich nicht: \(\rho_1 = \rho_2\)
\(H_{1}\): die beiden Korrelationen unterscheiden sich: \(\rho_1 \neq \rho_2\)
Prüfgröße: \(z=0.64\)
p-Wert: \(p=0.52\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler.
Interpretation der Testentscheidung: Es gibt in der Population keinen Unterschied zwischen den beiden Geschlechtern, was die Größe der Korrelation zwischen Verträglichkeit und Gewissenhaftigkeit angeht.
Es werden folgende Kontrollüberzeugungen unterschieden: Powerful others, internale Kontrollüberzeugung sowie Glaube in Schicksal, Gott oder Zufall. In einer einfaktoriellen Varianzanalyse wurde getestet, ob es Varianzunterschiede im akademischen Erfolg gibt, die durch die unterschiedlichen Kontrollüberzeugungen erklärt werden können (\(\alpha = .05\)).
Folgender R-Output ist gegeben:
## Df Sum Sq Mean Sq F value Pr(>F)
## Kontrollüberzeugung 2 47.4 23.700 8.11 0.00174 **
## Residuals 27 78.9 2.922
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Anzahl und Interpretation der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
\(\boldsymbol{H_{0}}\): \(\mu_{1} = \mu_{2} = \mu_{3}\)
\(\boldsymbol{H_{1}}\): \(\mu_{i} \neq \mu_{j}\)
Prüfgröße: \(F = 8.11\; mit \;df_{1} = 2,\; df_{2} = 27\)
Anzahl und Interpretation der Freiheitsgrade: \(df_{1}:\) Anzahl der Faktorstufen (3) - 1 = 2; \(df_{2}:\) Stichprobengröße (30) - Anzahl der Faktorstufen (3) = 27
p-Wert: 0.00174
Testentscheidung: Die \(H_0\) wird verworfen.
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler
Interpretation der Testentscheidung: Im Mittel unterscheidet sich der akademische Erfolg in Abhängigkeit von der Kontrollüberzeugung (powerful others/internal/Schicksal, Gott, Zufall) in der Population.
Da wir prüfen möchten, ob die Voraussetzungen für eine ANOVA gegeben sind, haben wir einen Levene-Test für die Prüfung der Homoskedastizitätsannahme mit \(\alpha = .20\) durchgeführt.
Folgender R-Output ist gegeben:
## Levene's Test for Homogeneity of Variance (center = mean)
## Df F value Pr(>F)
## group 2 0.0996 0.9056
## 27
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Gruppenanzahl: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
\(\boldsymbol{H_{0}}\): \(\sigma^{2}_{1} = \sigma^{2}_{2} = \sigma^{2}_{3}\)
\(\boldsymbol{H_{1}}\): \(\sigma_{i} \neq \sigma_{j}\)
Prüfgröße: \(F = 0.0996\; mit \;df_{1} = 2,\; df_{2} = 27\)
Gruppenanzahl: \(df_{1} = 2 \rightarrow 2 + 1 = 3\)
p-Wert: 0.9056
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\beta\)-Fehler
Interpretation der Testentscheidung: Die Varianzen der akademischen Erfolgswerte unterscheiden sich in der Population nicht zwischen den unterschiedlichen Kontrollüberzeugungen (powerful others/internal/Schicksal, Gott, Zufall).
Da wir prüfen möchten, ob die Voraussetzungen für eine ANOVA gegeben sind, haben wir Shapiro-Wilk-Tests für die Prüfung der Normalverteilungsannahme mit \(\alpha = .15\) durchgeführt.
Folgender R-Output ist gegeben:
##
## Shapiro-Wilk normality test
##
## data: data$Residuen[data$Kontrollüberzeugung == "powerful others"]
## W = 0.98372, p-value = 0.9819
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
\(\boldsymbol{H_{0}}\): Werte sind normalverteilt
\(\boldsymbol{H_{1}}\): Werte sind nicht normalverteilt
Prüfgröße: \(W = 0.97552\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\beta\)-Fehler
Interpretation der Testentscheidung: Die akademischen Erfolgswerte der Population mit der Kontrollüberzeugung “powerful others” sind normalverteilt.
In einer Studie wird untersucht, ob es Varianzunterschiede in der Symptomatik einer Panikstörung gibt, die durch die Effekte von Geschlecht und von 3 Treatment-Bedingungen (Medikation, Verhaltenstherapie, Kontrollgruppe) erklärt werden können:
## Df Sum Sq Mean Sq F value Pr(>F)
## treatment 2 253.4 126.7 74.529 5.06e-11 ***
## geschl 1 0.3 0.3 0.176 0.678
## treatment:geschl 2 54.2 27.1 15.941 3.94e-05 ***
## Residuals 24 40.8 1.7
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
\(H_{0}\):
\(H_{1}\):
Prüfgröße:
Aussage der Freiheitsgrade:
p-Wert:
Testentscheidung:
möglicher Fehler nach erfolgter Testentscheidung:
Jetzt werden die Interaktionsplots gezeichnet:
Welche “Effekte” sind interpretierbar? Wie lautet die Interpretation?
Jetzt interessiert man sich für den prozentualen Anteil der Variation in der abhängigen Variablen (Symptomatik der Panikstörung), der durch die beiden Haupt-“Effekte“ und die Interaktion aufgeklärt wird:
## eta.sq eta.sq.part
## treatment 0.7266991683 0.86131883
## geschl 0.0008603384 0.00729927
## treatment:geschl 0.1554344709 0.57052632
Welche Information gewinnen wir aus diesem Output?
Anteil der an der abhängigen Variablen aufgeklärten Variation durch:
eta.sq.part
ist für uns im Rahmen des Moduls Methodenlehre II nicht relevant.
An einer Hochschule wird der Einfluss von Geschlecht und der Zugehörigkeit zu einer von 4 Seminargruppen auf die Zufriedenheit mit dem Studium untersucht.
## Df Sum Sq Mean Sq F value Pr(>F)
## gruppe 3 2.66 0.8857 2.550 0.0578 .
## geschlecht 1 0.00 0.0047 0.014 0.9076
## gruppe:geschlecht 3 7.97 2.6555 7.646 8.45e-05 ***
## Residuals 155 53.83 0.3473
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Sum Sq Mean Sq F value Pr(>F)
## geschlecht 1 0.04 0.0394 0.113 0.7368
## gruppe 3 2.62 0.8742 2.517 0.0603 .
## geschlecht:gruppe 3 7.97 2.6555 7.646 8.45e-05 ***
## Residuals 155 53.83 0.3473
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Vergleiche die beiden Outputs. Worin unterscheiden sie sich und warum?
Folgende Unterschiede kann man feststellen:
All dies deutet darauf hin, dass in dieser Aufgabe ein unbalanciertes Design vorliegt. Hier wurde es mit Typ I Quadratsummen gerechnet, da die Reihenfolge, in der die Faktoren in das Modell afgenommen wurden, eine Rolle spielt. Außerdem ist Typ I die default-Einstellung in R.
Inhaltlicher Bezug:
Es wurde die Reaktionszeit einer Treatment- und einer Kontrollgruppe (group
) verglichen.
Dabei wurde jede Gruppe jeweils unter 3 Bedingungen (unterschiedlichen Flankierreizen, flank
) verglichen.
Vervollständige folgende Lücken zum Versuchsaufbau:
Abhängige Variable: ___________
Gruppierungsfaktor A: ___________
Messwiederholungsfaktor B: ___________
Es liegen folgende Variablen vor:
Abhängige Variable: Reaktionszeit
Gruppierungsfaktor A: Gruppierung in Treatment- und Kontrollgruppe \(\rightarrow\) between subject
Messwiederholungsfaktor B: Unterschiedliche Bedingungen, die jeder Proband durchläuft \(\rightarrow\) within subject
Folgender Output wird angegeben:
## $ANOVA
## Effect DFn DFd SSn SSd F p p<.05
## 1 (Intercept) 1 18 9931196.8132 438.7989 4.073883e+05 1.189834e-40 *
## 2 group 1 18 487.8639 438.7989 2.001270e+01 2.936428e-04 *
## 3 flank 2 36 81933.5426 1220.3700 1.208489e+03 9.976052e-34 *
## 4 group:flank 2 36 548.2483 1220.3700 8.086457e+00 1.257284e-03 *
## ges
## 1 0.9998330
## 2 0.2272270
## 3 0.9801518
## 4 0.2483664
##
## $`Mauchly's Test for Sphericity`
## Effect W p p<.05
## 3 flank 0.9247156 0.5141261
## 4 group:flank 0.9247156 0.5141261
##
## $`Sphericity Corrections`
## Effect GGe p[GG] p[GG]<.05 HFe p[HF] p[HF]<.05
## 3 flank 0.9299865 1.599628e-31 * 1.03282 9.976052e-34 *
## 4 group:flank 0.9299865 1.693610e-03 * 1.03282 1.257284e-03 *
Vervollständige folgende Lücken:
\(df_A\): _______________
\(df_{P(A)}\): _______________ \(df_B\): _______________
\(df_e\): _______________
\(QS_{AB}\): _______________
\(QS_e\): _______________
Empirische Prüfgröße des Gruppierungsfaktors A: _______________
p-Wert des Messwiederholungsfaktors B: _______________
Signifikanztestung mit \(\alpha\) = 0.05:
Gruppierungsfaktor B: die \(H_0\) wird _______________
Messwiederholungsfaktor A: die \(H_0\) wird _______________
Interaktion AB: die \(H_0\) wird _______________
\(df_A\): 1
\(df_{P(A)}\): 18
\(df_B\): 2
\(df_e\): 36
\(\rightarrow\) In der jeweiligen Zeile des entsprechenden Effekts (group
, flank
und group:flank
) stehen unter DFn
die Freiheitsgrade des Effekts, der bei Signifikanztestung im Zähler des F-Bruchs steht und unter DFd
die Freiheitsgrade des Effekts, der bei Signifikanztestung im Nenner des F-Bruchs steht.
\(\rightarrow\) Im Beispiel des Gruppierungsfaktors A (group
) lautet der F-Bruch \(F= \frac {QS_a} {QS_{P(A)}}\). Somit ist in dieser Zeile DFn
= \(df_A\) und DFd
= \(df_{P(A)}\).
\(QS_{AB}\): 548.25
\(QS_e\): 1220.37
\(\rightarrow\) Die Quadratsummen folgen hier demselben Prinzip wie die Freiheitsgrade: SSn
bezieht sich auf die QS des Effekts, der bei Signifikanztestung im Zähler des F-Bruchs steht und SSd
auf die QS des Effekts, der bei Signifikanztestung im Nenner des F-Bruchs steht.
Empirische Prüfgröße des Gruppierungsfaktors A: 2.001270e+01
p-Wert des Messwiederholungsfaktors B: 9.976052e-34
Signifikanztestung mit \(\alpha\) = 0.05:
Gruppierungsfaktor B: die \(H_0\) wird: verworfen
Messwiederholungsfaktor A: die \(H_0\) wird: verworfen
Interaktion AB: die \(H_0\) wird: verworfen
Voraussetzung zur sinnvollen Interpretation einer ANOVA mit Messwiederholungsfaktor ist die Zirkularität.
Vervollständige die folgenden Lücken mithilfe des oben aufgeführten Outputs der ezANOVA Funktion:
Greenhouse-Geisser-Epsilon \(\hat {\epsilon}\): _____________
Hynh-Feldt-Epsilon \(\tilde {\epsilon}\): _____________
Freiheitsgrade (ggf. nach Korrektur, wenn notwendig):
\(df_A\): __________
\(df_B\):____________
\(df_{AB}\):__________
Greenhouse-Geisser-Epsilon \(\hat {\epsilon}\): 0.93
Hynh-Feldt-Epsilon \(\tilde {\epsilon}\): 1.03
Freiheitsgrade (ggf. nach Korrektur, wenn notwendig):
\(df_A\): 1 \(\rightarrow\) bleibt unverändert, da nur B und AB von der Messwiederholung und somit von Zikrularität beeinflusst werden.
\(df_B \rightarrow\) Da der Messwiederholungsfaktor (logischerweise) von der Messwiederholung betroffen ist, müssen dessen Freiheitsgrade korrigiert werden.
Da dsa Greenhouse Geisser-Epsilon \(\hat{\epsilon}\) > 0.75 ist, wird das Hyunh-Feldt Epsilon \(\tilde{\epsilon}\) zur Korrektur herangezogen. In unserem Beispiel ist dieses jedoch größer als Eins (\(\tilde{\epsilon}\) > 1). Dementsprechend ist eine Korrektur der Freiheitsgrade nicht notwendig
\(df_{AB} \rightarrow\) Auch die Freiheitsgrade der Interaktion müssten theoretisch korrigiert werden, da auch die Interaktion von der Messwiederholung betroffen ist.
Da aber \(\tilde{\epsilon}\) > 1 ist, nehmen wir auch hier keine Korrektur vor.
Der Datensatz “women” beinhaltet Angaben zum Körpergewicht weight
(in Pfund) und der Körpergröße height
(in Inches) von US-amerikanischen Frauen. Basierend auf diesen Daten wurde eine einfache lineare Regression berechnet.
Folgender R-Output ist gegeben:
##
## Call:
## lm(formula = weight ~ height, data = women, na.action = "na.exclude")
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.7333 -1.1333 -0.3833 0.7417 3.1167
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -87.51667 5.93694 -14.74 1.71e-09 ***
## height 3.45000 0.09114 37.85 1.09e-14 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.525 on 13 degrees of freedom
## Multiple R-squared: 0.991, Adjusted R-squared: 0.9903
## F-statistic: 1433 on 1 and 13 DF, p-value: 1.091e-14
Vervollständige folgende Lücken:
Kriterium (AV): __________________
Prädiktor (UV):__________________
\(H_{0}\): _______________
\(H_{1}\): _______________
unstandardisierte Steigung b: _______________
Interpretation von b: ________________
Prüfgröße: _______________
Stichprobengröße n: _______________
Interpretation des Determinationskoeffizienten \(R^2\): _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
Kriterium (AV): weight
(Körpergewicht)
Prädiktor (UV): height
(Körpergröße) \(H_{0}\): \(\beta = 0\)
\(H_{1}\): \(\beta \neq 0\)
unstandardisierte Steigung b: 3.45
Interpretation von b: Bei zwei Frauen, die sich in ihrer Körpergröße um 1 Inch unterscheiden, erwarten wir einen Gewichtsunterschied von ca. 3.45 Pfund.
empirische Prüfgröße: \(t= 37.85\)
Stichprobengröße n: \(n = df + 2 = 13 + 2 = 15\)
Interpretation des Determinationskoeffizienten \(R^2\): \(R^2 = 0.991 \rightarrow\) der Anteil der Variation im Körpergewicht, die im linearen Modell durch die Körpergröße vorhergesagt wird, beträgt 99%.
Testentscheidung: Die \(H_0\) wird verworfen
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler (1. Art)
Interpretation der Testentscheidung: Das lineare Modell mit Körpergröße als Prädiktor kann Körpergewicht vorhersagen.
Wir können folgende Information aus dem R Output gewinnen:
Im ersten Teil Call
finden wir Angaben zur berechneten Formel:
Im zweiten Block werden Informatioen zu den Residuen gegeben.
Im Block darunter finden wir Angaben bezüglich der Regressionskoeffizienten: Die Zeile (Intercept)
bezieht sich auf den y-Achsenabschnitt und height
auf die Steigung/ das Regressionsgewicht der Regressionsgeraden
Estimate
gibt die Schätzung des jeweiligen Koeffizienten an.(intercept)
bezieht sich auf den AchsenabschnittsparameterStd. Error
gibt den Standardfehler des Regressionsgewichts \(s_b\) an. Er quantifiziert die Unsicherheit, mit der die Populationssteigung \(\beta\) durch die Steigung b geschätzt wirdt value
: empirischer t-Wert bei Signifikanztestung der jeweiligen Regressionskoeffizienten.Pr(>|t|)
: Angaben zum p-Wert: die Wahrscheinlichkeit, den vorliegenden empirischen t-Wert oder einen extremeren zu beobachten***
: Die Sternchen am Rand geben ggf. an, ab welchem \(\alpha\) Niveau der t-Wert signifikant ist. Die entsprechende Legende findet sich darunter unter Signif. codes
Im letzten Abschnitt des Outputs finden sich folgende Informationen:
Residual standard error
: Standardschätzfehler \(s_e\)on 13 degrees of freedom
: Freiheitsgrade (df); entspricht n-2Multiple R squared
: Determinationskoeffizient \(R^2\)Adjusted R-squared
: korrigierter Determinationskoeffizient \(R_{korr}^2\)F-statistic
bezieht sich auf die Testung des Gesamtmodells mit allen Prädiktoren
Wir möchten Lebenszufriedenheit durch Empathie, Verträglichkeit, Neurotizismus und Einsamkeit vorhersagen. Dazu führen wir eine multiple lineare Regression durch und erhalten folgenden R-Output:
Vervollständige folgende Lücken für \(\alpha = .05\):
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Anzahl und Interpretation der Freiheitsgrade: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
\(\boldsymbol{H_{0}}\): \(\rho^2 = 0 \; \beta_{1} = \beta_{2} = \beta_{3} = \beta_{4} =\beta_{5}\)
\(\boldsymbol{H_{1}}\): \(\rho^2 > 0 \; bzw. \; min. \; ein \; \beta_{j} \neq 0\)
Prüfgröße: \(F = 104.5\; mit\; df_{1} = 4,\; df_{2} = 95\)
Anzahl und Interpretation der Freiheitsgrade: \(df_{1}:\) Anzahl der Prädiktoren (5) - 1 = 4; \(df_{2}:\) Stichprobengröße (100) - Anzahl der Prädiktoren (5) = 95
Testentscheidung: Die \(H_0\) wird verworfen.
möglicher Fehler nach erfolgter Testentscheidung: \(\alpha\)-Fehler
Interpretation der Testentscheidung: Das Modell mit den Prädiktoren Empathie, Verträglichkeit, Neurotizismus und Einsamkeit kann Lebenszufriedenheit in der Population vorhersagen.
Da wir prüfen möchten, ob die Voraussetzungen für eine multiple lineare Regression gegeben sind, haben wir folgenden Residualplot erstellt:
Sind die Annahmen der Homoskedastizität und der Linearität erfüllt?
Beide Annahmen sind in diesem Fall erfüllt.
An einer Berliner Uni will man herausfinden, ob die Erstsemestler einen lokalen Anstieg in Neurotizismus-Werten erfahren in Abhängigkeit davon, woher sie kommen. Dazu wird der Wohnort vor der Studiumaufnahme erhoben und wie folgt kategorisiert: alte Bundesländer(\(a_1\)), neue Bundesländer (\(a_2\)), Ausland (\(a_3\)), Berlin (\(a_4\)). Nachdem die Herkunft dummykodiert ist (Berlin = Referenzgruppe), führt man eine lineare Regression durch (\(\alpha=0.05\)).
##
## Call:
## lm(formula = neurotizismus ~ d1 + d2 + d3, data = studis)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.500 -0.500 0.000 0.500 1.683
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.50000 0.07716 45.361 <2e-16 ***
## d1 0.05645 0.14926 0.378 0.706
## d2 -0.18269 0.15943 -1.146 0.254
## d3 -0.04412 0.18900 -0.233 0.816
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7114 on 155 degrees of freedom
## Multiple R-squared: 0.01148, Adjusted R-squared: -0.007649
## F-statistic: 0.6002 on 3 and 155 DF, p-value: 0.6158
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
\(H_{0}\):
\(H_{1}\):
Prüfgröße:
Aussage der Freiheitsgrade:
p-Wert:
Testentscheidung:
möglicher Fehler nach erfolgter Testentscheidung:
Interpretation der Testentscheidung:
Zur Vorhersage von Depressivität (\(y\)) nach einer von 3 Behandlungsarten (Verhaltenstherapie (\(a_1\)), Psychoanalyse (\(a_2\)), Medikation (\(a_3\))) soll eine multiple lineare Regression (\(\alpha = 0.05\)) durchgeführt werden. Nun werden zwei effektkodierte Indikatorvariablen erstellt, um das Kriterium \(y\) vorherzusagen. Medikation wurde als Referenzgruppe festgelegt.
##
## Call:
## lm(formula = Depressivitaet ~ e1 + e2, data = d1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1 -1 0 1 1
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 11.0000 0.3333 33.000 5.15e-08 ***
## e1 -6.0000 0.4714 -12.728 1.44e-05 ***
## e2 1.0000 0.4714 2.121 0.0781 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1 on 6 degrees of freedom
## Multiple R-squared: 0.9688, Adjusted R-squared: 0.9583
## F-statistic: 93 on 2 and 6 DF, p-value: 3.052e-05
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
\(H_{0}\):
\(H_{1}\):
Prüfgröße:
Aussage der Freiheitsgrade:
p-Wert:
Testentscheidung:
möglicher Fehler nach erfolgter Testentscheidung:
Interpretation der Testentscheidung:
Zur Vorhersage von Einstellung zum Klimawandel (\(y\)) wird die Zugehörigkeit zur Partei \(M\) vs. \(N\) angeschaut. Mit einer kontrastkodierten Indikatorvariable wird eine lineare Regression (\(\alpha=0.05\)) gerechnet.
##
## Call:
## lm(formula = Einstellung ~ Kontrast, data = d)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.1667 -0.8333 0.0000 0.8333 1.1667
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.0000 0.2838 3.523 0.00551 **
## Kontrast 0.1667 0.2838 0.587 0.57008
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.9832 on 10 degrees of freedom
## Multiple R-squared: 0.03333, Adjusted R-squared: -0.06333
## F-statistic: 0.3448 on 1 and 10 DF, p-value: 0.5701
Vervollständige folgende Lücken:
\(H_{0}\): _______________
\(H_{1}\): _______________
Prüfgröße: _______________
Aussage der Freiheitsgrade: _______________
p-Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
Interpretation der Testentscheidung: _______________
\(H_{0}\):
\(H_{1}\):
Prüfgröße:
Aussage der Freiheitsgrade:
p-Wert:
Testentscheidung:
möglicher Fehler nach erfolgter Testentscheidung:
Interpretation der Testentscheidung: