Welche Aussage bezüglich Streudiagramme ist falsch?
Ein Streudiagramm gibt einen Eindruck von der gemeinsamen Verteilung von zwei (metrischen) Variablen.
Besteht zwischen zwei Variablen ein linearer Zusammenhang, so kann man ihn mit einer Geraden beschreiben.
Wenn alle x-Werte, die oberhalb von x quer liegen, mit y-Werten einhergehen, die unterhalb von y quer liegen und umgekehrt, so liegt ein negativer (linearer) Zusammenhang vor.
Ist der lineare Zusammenhang zweier Variablen positiv, so sind auch alle Abweichungsprodukte positiv.
Ein Streudiagramm gibt einen Eindruck von der gemeinsamen Verteilung von zwei (metrischen) Variablen.
RICHTIG.
Besteht zwischen zwei Variablen ein linearer Zusammenhang, so kann man ihn mit einer Geraden beschreiben.
RICHTIG.
Wenn alle x-Werte, die oberhalb von x quer liegen, mit y-Werten einhergehen, die unterhalb von y quer liegen und umgekehrt, so liegt ein negativer (linearer) Zusammenhang vor.
RICHTIG.
Ist der lineare Zusammenhang zweier Variablen positiv, so sind auch alle Abweichungsprodukte positiv.
FALSCH. Nur die Summe der Abweichungsprodukte muss positiv sein.
Gegeben sind die beiden folgenden Messwertreihen zzgl. einiger deskriptiver Kennzahlen:
\(x: 2, 6, 10; \bar{x} = 6, {s_x}^2 = 16\)
\(y: 7, 5, 3; \bar{y}= 5, {s_y}^2 = 4\)
(a) Berechne die Kovarianz \(s_{xy}\) und die Produkt-Moment-Korrelation \(r_{xy}\).
Berechnung der Kovarianz:
x-Werte | y-Werte | \((x_i-\bar{x})\) | \((y_i-\bar{y})\) | \((x_i-\bar{x})(y_i-\bar{y})\) |
---|---|---|---|---|
2 | 7 | \(2-6=-4\) | \(7-5=2\) | \(-4\cdot2\) |
6 | 5 | \(6-6=0\) | \(5-5=0\) | \(0\) |
10 | 3 | \(10-6=4\) | \(3-5=-2\) | \(4\cdot(-2)\) |
Berechnung der Produkt-Moment Korrelation:
(b) Welche Aussage ist falsch?
(c) Welche Aussage ist korrekt?
In zwei Untersuchungen wurden folgende Zusammenhange zwischen zwei psychologischen Variablen gefunden:
\(r_1 = .50; r_2 = .80\).
(a) Wie lautet der durchschnittliche Korrelationskoeffzient, wenn wir davon ausgehen können, dass die untersuchten Stichproben gleich groß waren?
Welcher Test sollte für die folgenden Szenarien genutzt werden?
In einer Untersuchung zur Qualität sozialer Beziehungen im jungen Erwachsenenalter wurde ein schwach negativer linearer Zusammenhang zwischen wahrgenommener Unsicherheit und Kontakthäufigkeit von \(r = -.15\) gefunden. Insgesamt bestand die repräsentative Stichprobe aus \(n = 122\) Personen.
(a) Prüfe zweiseitig und mit einer Irrtumswahrscheinlichkeit von \(\alpha=.01\), ob der gefundene Zusammenhang statistisch signifikant ist und fülle die nachfolgenden Lücken aus!
\(H_0\): _______________
\(H_1\): _______________
Prüfgröße: _______________
kritischer Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
die Fragestellung hier lautet: Weicht die empirisch ermittelte Korrelation \(r =-.15\) signifikant von der Annahme ab, dass kein linearer Zusammenhang zwischen den untersuchten Variablen in der Population besteht?
es wird nur eine Stichprobe untersucht
1-Stichprobentest mit \(H_0: \rho = 0\) und \(H_1: \rho \neq 0\) (erschöpfend formuliert)
Prüfgröße berechnen: \[t = \frac{r\cdot \sqrt{n-2}}{\sqrt{1-r^2}} = \frac{-.15\cdot \sqrt{122-2}}{\sqrt{1-(-.15)^2}} \approx -1.662\]
kritischen Wert bestimmen:
kritischer Wert: \(t_{120;99,5\%} = \pm 2.617\)
jetzt vergleichen wir die Prüfgröße mit dem kritischen Wert: \[t_{krit} = \pm 2.617> |-1.662|\]
der Betrag der Prüfgröße ist kleiner als der kritische Wert \(\Rightarrow\) die Nullhypothese, dass die Stichprobenkorrelation mit der Populationskorrelation übereinstimmt, wird beibehalten
dabei können wir den \(\beta\)-Fehler begehen, d.h. die Nullhypothese zu Unrecht beibehalten
\(H_0\): \(\boldsymbol{\rho = 0}\)
\(H_1\): \(\boldsymbol{\rho \neq 0}\)
Prüfgröße: \(\boldsymbol{-1.662}\) mit \(\boldsymbol{df = 120}\)
kritischer Wert: \(\boldsymbol{t_{120; 99.5\%} = \pm 2.617}\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler
(b) Wie groß müsste die Korrelation zwischen wahrgenommener Unsicherheit und Kontakthäufigkeit diesmal mindestens sein, um ein signifikantes Ergebnis erzielen zu können (\(\alpha = 0.01\))?
Eine kritische Korrelation ist eine Korrelation, die die ForscherInnen mindestens in ihrer Stichprobe (N=122) entdecken sollen, damit der Zusammenhang zwischen wahrgenommener Unsicherheit und Kontakthäufigkeit signifikant (\(\alpha=0.01\)) unterschiedlich von 0 wird.
Um diese zu bestimmen, brauchen wir die Formel für den Signifikanztest von \(H_0\): \(\rho=0\), die wir nach \(r\), also die Korrelation in der Stichprobe, umstellen wollen:
\[t = \frac{r\cdot \sqrt{n-2}}{\sqrt{1-r^2}}\]\[\frac{t}{\sqrt{n-2}} = \frac{r}{\sqrt{1-r^2}}\]
\[\frac{t^2}{n-2} = \frac{r^2}{1-r^2}\]
\[\frac{1-r^2}{r^2} = \frac{n-2}{t^2}\]
\[\frac{1}{r^2}-\frac{r^2}{r^2} = \frac{n-2}{t^2}\] \[\frac{1}{r^2}-1 = \frac{n-2}{t^2}\]
\[\frac{1}{r^2} = \frac{n-2}{t^2}+1\] \[\frac{1}{r^2} = \frac{n-2}{t^2}+\frac{t^2}{t^2}\] \[\frac{1}{r^2} = \frac{(n-2)+t^2}{t^2}\]
Wir tauschen wieder die Terme, d.h. wir multiplizieren die beiden Seiten jeweils mit \(r^2\) und \(\frac{t^2}{(n-2)+t^2}\): \[\frac{t^2}{(n-2)+t^2} = r^2\]
Dann ziehen wir die Wurzel und bekommen die gesuchte Gleichung:
\[\sqrt{\frac{t^2}{(n-2)+t^2}} = r\]
Nach der Umstellung bekommen wir die folgende Formel:
\[r= \sqrt{\frac{t^2}{(n-2)+t^2}}\]
Jetzt bestimmen wir den kritischen \(t\)-Wert, den wir danach in die Gleichung einsetzen. Das soll ein kritischer Wert \(t_{df=n-2; 1-\frac{\alpha}{2}}\) sein, da die Prüfgröße \(t\) mit \(n-2\) Freiheitsgraden \(t\)-verteilt ist. Zudem suchen wir die kritische Korrelation zweiseitig, da wir in der Aufgabe a) zweiseitig getestet haben.
Wir schauen also den Wert \(t_{122-2;99.5\%}\) in der Tabelle nach und bestimmen so den kritischen Wert \(t=2.617\).
Jetzt können wir alles in die vorher umgestellte Formel einsetzen:
\[r= \sqrt{\frac{t^2}{(n-2)+t^2}} = \sqrt{\frac{2.617^2}{(122-2)+2.617^2}} = 0.232\]
Also, hätte die Korrelation in der Stichprobe mindestens \(\pm0.232\) betragen müssen, um bei der Testung signifikant zu werden.
In einer Untersuchung bei Absolventinnen und Absolventen (\(n = 100\)) einer Berliner Universität beträgt die Korrelation zwischen der Uni-Abschlussnote und der Abiturnote \(r = 0.42\). Es soll überprüft werden, ob die Absolventinnen und Absolventen in Bezug auf den untersuchten Merkmalszusammenhang zu einer Grundgesamtheit, in der eine Korrelation \(\rho_0 = 0.50\) gilt, zählen.
(a) Prüfe zweiseitig und mit einer Irrtumswahrscheinlichkeit von \(\alpha=.05\) und fülle die nachfolgenden Lücken aus!
\(H_0\): _______________
\(H_1\): _______________
Prüfgröße: _______________
kritischer Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
\(H_0\): \(\boldsymbol{\rho = 0.50}\)
\(H_1\): \(\boldsymbol{\rho \neq 0.50}\)
Prüfgröße: \(\boldsymbol{-1.001}\)
kritischer Wert: \(\boldsymbol{z_{97.5\%} = \pm 1.96}\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler
(b) Als Ergebnis sollen die Forscher die empirische Korrelation zusammen mit dem zugehörigen 95%-Konfidenzintervall berichten. Berechne dieses Konfidenzintervall!
\[Z = \frac{1}{2}\cdot\ln{\frac{1+0.42}{1-0.42}} \approx 0.448\]
\[ Z \pm z_{1-\frac{\alpha}{2}} \cdot \frac{1}{\sqrt{n-3}}\]
Dafür brauchen wir den zweiseitigen kritischen \(z\)-Wert für 95%-KI: \(z_{97.5\%}= 1.96\) und die Stichprobengröße (N=100 aus der Aufgabe a))
Wir berechnen die Grenzen des KI:
Jetzt transformieren wir die \(Z\)-Werte in die \(r\)-Äquivalente und berechnen die Konfidenzintervallgrenzen für die Korrelationen:
\[r=\frac{e^{2\cdot Z}-1}{e^{2\cdot Z}+1}\]
Das 95%-Konfidenzintervall beträgt \([0.244; 0.570]\). Auch daran sehen wir, dass die empirische Korrelation \(r=0.42\) nicht signifikant unterschiedlich von \(\rho_0=0.50\) ist, da das KI den Populationsparameter umschließt.
In zwei unabhängigen Untersuchungen frisch (Gr. \(1\)) und schon mindestens \(20\) Jahre (Gr. \(2\)) verheirateter Ehepaare (\(n_1 = 50, n_2 = 60\)) wurde die Ähnlichkeit der beiden Partner in einem Interessentest untersucht. Die beiden gefundenen Korrelationen betrugen \(r_1 = 0.30\) und \(r_2 = 0.55\).
(a) Ist der Unterschied zwischen den Korrelationen bei zweiseitigem Test mit einem \(\alpha = .05\) statistisch signifikant? Fülle die nachfolgenden Lücken aus!
\(H_0\): _______________
\(H_1\): _______________
Prüfgröße: _______________
kritischer Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________
\(H_0\): \(\boldsymbol{\rho_1 = \rho_2}\)
\(H_1\): \(\boldsymbol{\rho_1 \neq \rho_2}\)
Prüfgröße: \(\boldsymbol{-1.563}\)
kritischer Wert: \(\boldsymbol{z_{97.5\%} = \pm 1.96}\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler
Die folgenden Eigenschaften werden in folgender Weise gemessen:
Mit welchen Verfahren können die Zusammenhänge zwischen folgenden Merkmalen quantifiziert werden?
Um richtige Verfahren für die Messung der jeweiligen Zusammenhänge zu ermitteln, sollten wir uns an die Tabelle aus der Vorlesung erinnern, in der die die Korrelationsverfahren in Abhängigkeit von den Skalenniveaus der beiden zu korrelierenden Variablen angegeben wurden.
Jetzt sollen wir die Skalenniveaus der Variablen jeweils in der Tabelle nachschauen und die passende Korrelationstechnik bestimmen: