Streudiagramme

Welche Aussage bezüglich Streudiagramme ist falsch?


  1. Ein Streudiagramm gibt einen Eindruck von der gemeinsamen Verteilung von zwei (metrischen) Variablen.

  2. Besteht zwischen zwei Variablen ein linearer Zusammenhang, so kann man ihn mit einer Geraden beschreiben.

  3. Wenn alle x-Werte, die oberhalb von x quer liegen, mit y-Werten einhergehen, die unterhalb von y quer liegen und umgekehrt, so liegt ein negativer (linearer) Zusammenhang vor.

  4. Ist der lineare Zusammenhang zweier Variablen positiv, so sind auch alle Abweichungsprodukte positiv.


Lösung
  1. Ein Streudiagramm gibt einen Eindruck von der gemeinsamen Verteilung von zwei (metrischen) Variablen.
    RICHTIG.

  2. Besteht zwischen zwei Variablen ein linearer Zusammenhang, so kann man ihn mit einer Geraden beschreiben.
    RICHTIG.

  3. Wenn alle x-Werte, die oberhalb von x quer liegen, mit y-Werten einhergehen, die unterhalb von y quer liegen und umgekehrt, so liegt ein negativer (linearer) Zusammenhang vor.
    RICHTIG.

  4. Ist der lineare Zusammenhang zweier Variablen positiv, so sind auch alle Abweichungsprodukte positiv.
    FALSCH. Nur die Summe der Abweichungsprodukte muss positiv sein.


Kovarianz, Produkt-Moment Korrelation und Transformation

Gegeben sind die beiden folgenden Messwertreihen zzgl. einiger deskriptiver Kennzahlen:
\(x: 2, 6, 10; \bar{x} = 6, {s_x}^2 = 16\)
\(y: 7, 5, 3; \bar{y}= 5, {s_y}^2 = 4\)

(a) Berechne die Kovarianz \(s_{xy}\) und die Produkt-Moment-Korrelation \(r_{xy}\).


Lösung

Berechnung der Kovarianz:

  • zuerst werden die Abweichungen der einzelnen Messwerte von dem jeweiligen Mittelwert berechnet
  • dann sollten die Abweichungsprodukte der Messwertepaare berechnet werden:
x-Werte y-Werte \((x_i-\bar{x})\) \((y_i-\bar{y})\) \((x_i-\bar{x})(y_i-\bar{y})\)
2 7 \(2-6=-4\) \(7-5=2\) \(-4\cdot2\)
6 5 \(6-6=0\) \(5-5=0\) \(0\)
10 3 \(10-6=4\) \(3-5=-2\) \(4\cdot(-2)\)
  • dabei sollte man die Messwertpaare einhalten, d.h. zu \(x_1\) \(y_1\) und zu \(x_2\) \(y_2\) nehmen
  • Dann wird die Summe der Abweichungsprodukte gebildet \[\sum_{i=1}^n (x_i- \bar{x})\cdot(y_i- \bar{y})=(2-6)\cdot(7-5) \\ +(6-6)\cdot(5-5)+(10-6)\cdot(3-5)=16\]
  • danach teilt man die Summe der Abweichungsprodukte durch \(n-1\), wobei \(n\) die Anzahl der Messwertepaare ist \[s_{xy}=\frac {\sum_{i=1}^n (x_i- \bar{x})\cdot(y_i- \bar{y})}{n-1}=\frac {16}{3-1}=-8\]

Berechnung der Produkt-Moment Korrelation:

  • man teilt die erhaltene Kovarianz \(s_{xy}\) durch das Produkt der Varianzen \(s_x\) und \(s_y\) \[r_{xy}=\frac {s_{xy}}{s_x \cdot s_y}=\frac {-8}{\sqrt{16} \cdot \sqrt{4}}=-1\]


(b) Welche Aussage ist falsch?

  1. Die Korrelation \(r_{xy}\) ändert sich nicht, wenn jeder Wert von \(x\) mit \(a^2\) multipliziert wird.
  2. Die Korrelation \(r_{xy}\) ändert sich, wenn jeder Wert von \(y\) quadriert wird.
  3. Die Korrelation \(r_{xy}\) ändert sich, wenn der erste und letzte Wert von \(x\) vertauscht werden.
  4. Die Korrelation \(r_{xy}\) ändert sich, wenn jeder Wert von \(x\) und \(y\) \(z\)-transformiert wird.

Lösung
  1. Die Korrelation \(r_{xy}\) ändert sich nicht, wenn jeder Wert von \(x\) mit \(a^2\) multipliziert wird.
    RICHTIG. Korrelationen sind invariant gegenüber linearen Transformationen \(u = a + b\cdot{x}\). Hier ist \(a=0\), \(b=a^2\).
  2. Die Korrelation \(r_{xy}\) ändert sich, wenn jeder Wert von \(y\) quadriert wird.
    RICHTIG. Korrelationen sind nur invariant gegenüber linearen Transformationen. Quadrieren ist keine lineare Transformation.
  3. Die Korrelation \(r_{xy}\) ändert sich, wenn der erste und letzte Wert von \(x\) vertauscht werden.
    RICHTIG. Korrelationen sind nur invariant gegenüber linearen Transformationen. Messwertpaare müssen beibehalten werden.
  4. Die Korrelation \(r_{xy}\) ändert sich, wenn jeder Wert von \(x\) und \(y\) \(z\)-transformiert wird.
    FALSCH. Korrelationen sind invariant gegenüber linearen Transformationen wie der \(z\)-Transformation.


(c) Welche Aussage ist korrekt?

  1. Die Kovarianz ist ein standardisiertes Zusammenhangsmaß, welches zur Beschreibung von linearen Zusammenhängen verwendet wird.
  2. Im Gegensatz zur Kovarianz kann die Korrelation nicht nur lineare sondern auch andere Zusammenhänge beschreiben. Daher eignet sich die Korrelation auch besser als Zusammenhangsmaß.
  3. Bei einem perfekten linearen Zusammenhang zwischen \(x\) und \(y\) liegen alle Punkte im Streudiagramm auf einer Geraden.
  4. Der Korrelationskoeffzient \(r\) ist die Kovarianz geteilt durch die Varianz von \(x\) und \(y\).

Lösung
  1. Die Kovarianz ist ein standardisiertes Zusammenhangsmaß, welches zur Beschreibung von linearen Zusammenhängen verwendet wird.
    FALSCH, die Kovarianz ist ein nicht-standardisiertes Zusammenhangsmaß.
  2. Im Gegensatz zur Kovarianz kann die Korrelation nicht nur lineare sondern auch andere Zusammenhänge beschreiben. Daher eignet sich die Korrelation auch besser als Zusammenhangsmaß.
    FALSCH, Korrelation beschreibt, genauso wie die Kovarianz, lineare Zusammenhänge.
  3. Bei einem perfekten linearen Zusammenhang zwischen \(x\) und \(y\) liegen alle Punkte im Streudiagramm auf einer Geraden.
    RICHTIG. Das werden wir uns im Rahmen der linearen Regression nochmal genauer ansehen. Erstmal aber: je enger der Zusammenhang, desto weniger ähnelt das Muster, in dem die Messwerte im Streudiagramm liegen, einem Kreis.
  4. Der Korrelationskoeffzient \(r\) ist die Kovarianz geteilt durch die Varianz von \(x\) und \(y\).
    FALSCH, \(r\) ist de Kovarianz geteilt durch das Produkt der Standardabweichungen von \(x\) und \(y\).



Fisher \(Z\)-Transformation

In zwei Untersuchungen wurden folgende Zusammenhange zwischen zwei psychologischen Variablen gefunden:

\(r_1 = .50; r_2 = .80\).

(a) Wie lautet der durchschnittliche Korrelationskoeffzient, wenn wir davon ausgehen können, dass die untersuchten Stichproben gleich groß waren?


Lösung
  • Als Erstes sollte man die \(r\)-Werte in \(Z\)-Werte umrechnen, da die Abstände bei \(r\)-Werten im Gegensatz zu \(Z\)-Werten nicht interpretierbar sind: \[Z = \frac{1}{2}\cdot\ln{\frac{1+r}{1-r}}\] \[Z_1 = \frac{1}{2}\cdot\ln{\frac{1+0.50}{1-0.50}} \approx 0.549\] \[Z_2 = \frac{1}{2}\cdot\ln{\frac{1+0.80}{1-0.80}} \approx 1.099\]
  • Danach mittelt man die \(Z\)-Werte \[\bar{Z}=\frac{Z_1+Z_2}{2} = \frac{0.549+1.099}{2}=0.824\]
  • Den erhaltenen \(Z\)-Wert sollte man rücktransformieren in einen \(r\)-Wert \[\bar{r} = \frac{e^{2\cdot Z}-1}{e^{2\cdot Z}+1}= \frac{e^{2\cdot 0.824}-1}{e^{2\cdot 0.824}+1} \approx 0.68\]


Prüfung von Korrelationshypothesen

Welcher Test sollte für die folgenden Szenarien genutzt werden?

  1. Entspricht die in meiner Untersuchung gefundene Korrelation von Motivation und Leistung dem Wert aus einer Meta-Analyse?
  2. Gibt es einen Zusammenhang zwischen besuchten Tutoriumssitzungen und der Klausurnote?
  3. Ist die Korrelation zwischen Bewegung und Rückenschmerzen in verschiedenen Altersgruppen (“Alt” und “Jung”) gleich?
  4. Ist die Korrelation zwischen Intelligenz und Noten in einer Erhebung bei Grundschüler_innen (N=100) und Schüler_innen der Oberstufe (N=120) gleich? (Es wurde der gleiche Intelligenztest verwendet.)
  5. Entspricht der Zusammenhang zwischen Schlafdauer und Aufmerksamkeit dem in der Literaturrecherche gefundenen Wert?
Lösung
  1. Entspricht die in meiner Untersuchung gefundene Korrelation von Motivation und Leistung dem Wert aus einer Meta-Analyse?
    1-Stichprobentest, \(H_0: \rho = \rho_0\) Es findet nur eine Untersuchung statt, die mit einem “wahren” Populationsparameter (hier aus einer Metaanalyse) verglichen wird.
  2. Gibt es einen Zusammenhang zwischen besuchten Tutoriumssitzungen und der Klausurnote?
    1-Stichprobentest, \(H_0: \rho = 0\) Es findet nur eine Untersuchung statt und dieser Zusammenhang wird darauf überprüft, ob er signifikant von 0 verschieden ist. Wenn dies der Fall ist scheint es in der Population einen Zusammenhang zu geben.
  3. Ist die Korrelation zwischen Bewegung und Rückenschmerzen in verschiedenen Altersgruppen (“Alt” und “Jung”) gleich?
    2-Stichprobentest, \(H_0: \rho_1 = \rho_2\) Es werden zwei unabhängige Stichproben untersucht, weswegen wir prüfen können, ob sich diese beiden erhobenen Korrelationen signifikant voneinander unterscheiden.
  4. Ist die Korrelation zwischen Intelligenz und Noten in einer Erhebung bei Grundschüler_innen (N=100) und Schüler_innen der Oberstufe (N=120) gleich? (Es wurde der gleiche Intelligenztest verwendet.)
    2-Stichprobentest, \(H_0: \rho_1 = \rho_2\) Es werden zwei unabhängige Stichproben untersucht, weswegen wir prüfen können, ob sich diese beiden erhobenen Korrelationen signifikant voneinander unterscheiden.
  5. Entspricht der Zusammenhang zwischen Schlafdauer und Aufmerksamkeit dem in der Literaturrecherche gefundenen Wert?
    1-Stichprobentest, \(H_0: \rho = \rho_0\) Es findet nur eine Untersuchung statt, die mit einem “wahren” Populationsparameter (hier aus einer Literaturrecherche) verglichen wird. Allerdings wäre es besser, die Daten von den Autor_innen direkt zu erhalten, um einen 2-Stichprobentest \(H_0: \rho_1 = \rho_2\) rechnen zu können.



In einer Untersuchung zur Qualität sozialer Beziehungen im jungen Erwachsenenalter wurde ein schwach negativer linearer Zusammenhang zwischen wahrgenommener Unsicherheit und Kontakthäufigkeit von \(r = -.15\) gefunden. Insgesamt bestand die repräsentative Stichprobe aus \(n = 122\) Personen.

(a) Prüfe zweiseitig und mit einer Irrtumswahrscheinlichkeit von \(\alpha=.01\), ob der gefundene Zusammenhang statistisch signifikant ist und fülle die nachfolgenden Lücken aus!

\(H_0\): _______________
\(H_1\): _______________
Prüfgröße: _______________
kritischer Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________


Lösungsansatz
  • den 1-Stichprobentest mit \(H_0: \rho = 0\) durchführen
  • Prüfgröße berechnen \[t = \frac{r\cdot \sqrt{n-2}}{\sqrt{1-r^2}}\]
  • Freiheitsgrade berechnen \[df = n-2\]
  • den kritischen Wert in der Tabelle der \(t\)-Verteilung nachschauen
  • die Prüfgröße mit dem kritischen Wert vergleichen und Testentscheidung treffen



Lösung
  • die Fragestellung hier lautet: Weicht die empirisch ermittelte Korrelation \(r =-.15\) signifikant von der Annahme ab, dass kein linearer Zusammenhang zwischen den untersuchten Variablen in der Population besteht?

  • es wird nur eine Stichprobe untersucht

  • 1-Stichprobentest mit \(H_0: \rho = 0\) und \(H_1: \rho \neq 0\) (erschöpfend formuliert)

  • Prüfgröße berechnen: \[t = \frac{r\cdot \sqrt{n-2}}{\sqrt{1-r^2}} = \frac{-.15\cdot \sqrt{122-2}}{\sqrt{1-(-.15)^2}} \approx -1.662\]

  • kritischen Wert bestimmen:

    • zuerst dazugehörige Freiheitsgrade berechnen: \[df = n-2=122-2=120\]
    • wir testen zweiseitig: wir wollen feststellen, ob sich die Korrelation in der Stichprobe signifikant von der in der Population unterscheidet.
    • dafür sollten wir das Signifikanzniveau \(\boldsymbol{\alpha}\) durch \(\boldsymbol{2}\) teilen: wir wollen uns die beiden Seiten der Verteilung anschauen
    • somit brauchen wir einen kritischen Wert für \(1- \frac{0.01}{2} = 1-0.005 = 0.995 = 99.5\%\)
    • wir schauen in der Tabelle der \(t\)-Verteilung für \(t_{120;99,5\%}\) nach:

  • kritischer Wert: \(t_{120;99,5\%} = \pm 2.617\)

  • jetzt vergleichen wir die Prüfgröße mit dem kritischen Wert: \[t_{krit} = \pm 2.617> |-1.662|\]

  • der Betrag der Prüfgröße ist kleiner als der kritische Wert \(\Rightarrow\) die Nullhypothese, dass die Stichprobenkorrelation mit der Populationskorrelation übereinstimmt, wird beibehalten

  • dabei können wir den \(\beta\)-Fehler begehen, d.h. die Nullhypothese zu Unrecht beibehalten

\(H_0\): \(\boldsymbol{\rho = 0}\)
\(H_1\): \(\boldsymbol{\rho \neq 0}\)
Prüfgröße: \(\boldsymbol{-1.662}\) mit \(\boldsymbol{df = 120}\)
kritischer Wert: \(\boldsymbol{t_{120; 99.5\%} = \pm 2.617}\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler


(b) Wie groß müsste die Korrelation zwischen wahrgenommener Unsicherheit und Kontakthäufigkeit diesmal mindestens sein, um ein signifikantes Ergebnis erzielen zu können (\(\alpha = 0.01\))?


Lösungsansatz
  • Gleichung für die Prüfgröße nach \(r\) auflösen
  • für das 1%-Niveau bei gegebener Anzahl von Freiheitsgraden die Signifikanzgrenze (Korrelation \(r\)) berechnen



Lösung

Eine kritische Korrelation ist eine Korrelation, die die ForscherInnen mindestens in ihrer Stichprobe (N=122) entdecken sollen, damit der Zusammenhang zwischen wahrgenommener Unsicherheit und Kontakthäufigkeit signifikant (\(\alpha=0.01\)) unterschiedlich von 0 wird.

Um diese zu bestimmen, brauchen wir die Formel für den Signifikanztest von \(H_0\): \(\rho=0\), die wir nach \(r\), also die Korrelation in der Stichprobe, umstellen wollen:

\[t = \frac{r\cdot \sqrt{n-2}}{\sqrt{1-r^2}}\]
Umstellung (zum besseren Verständnis)
  • Wir teilen die beiden Seiten der Gleichung durch \(\sqrt{n-2}\):

\[\frac{t}{\sqrt{n-2}} = \frac{r}{\sqrt{1-r^2}}\]

  • Wir quadrieren die beiden Seiten der Gleichung:

\[\frac{t^2}{n-2} = \frac{r^2}{1-r^2}\]

  • Wir bringen die beiden Terme jeweils auf die andere Seite der Gleichung, d.h. wir multiplizieren beide Seiten der Gleichung jeweils mit \(\frac{1-r^2}{r^2}\) und \(\frac{n-2}{t^2}\):

\[\frac{1-r^2}{r^2} = \frac{n-2}{t^2}\]

  • Wir teilen den Subtraktionsterm auf der linken Seite in zwei auf:

\[\frac{1}{r^2}-\frac{r^2}{r^2} = \frac{n-2}{t^2}\] \[\frac{1}{r^2}-1 = \frac{n-2}{t^2}\]

  • Dann bringen wir die 1 auf die andere Seite der Gleichung und schreiben diese wie \(\frac{t^2}{t^2}\) auf:

\[\frac{1}{r^2} = \frac{n-2}{t^2}+1\] \[\frac{1}{r^2} = \frac{n-2}{t^2}+\frac{t^2}{t^2}\] \[\frac{1}{r^2} = \frac{(n-2)+t^2}{t^2}\]

  • Wir tauschen wieder die Terme, d.h. wir multiplizieren die beiden Seiten jeweils mit \(r^2\) und \(\frac{t^2}{(n-2)+t^2}\): \[\frac{t^2}{(n-2)+t^2} = r^2\]

  • Dann ziehen wir die Wurzel und bekommen die gesuchte Gleichung:

\[\sqrt{\frac{t^2}{(n-2)+t^2}} = r\]


Nach der Umstellung bekommen wir die folgende Formel:

\[r= \sqrt{\frac{t^2}{(n-2)+t^2}}\]

Jetzt bestimmen wir den kritischen \(t\)-Wert, den wir danach in die Gleichung einsetzen. Das soll ein kritischer Wert \(t_{df=n-2; 1-\frac{\alpha}{2}}\) sein, da die Prüfgröße \(t\) mit \(n-2\) Freiheitsgraden \(t\)-verteilt ist. Zudem suchen wir die kritische Korrelation zweiseitig, da wir in der Aufgabe a) zweiseitig getestet haben.

Wir schauen also den Wert \(t_{122-2;99.5\%}\) in der Tabelle nach und bestimmen so den kritischen Wert \(t=2.617\).

Jetzt können wir alles in die vorher umgestellte Formel einsetzen:

\[r= \sqrt{\frac{t^2}{(n-2)+t^2}} = \sqrt{\frac{2.617^2}{(122-2)+2.617^2}} = 0.232\]

Also, hätte die Korrelation in der Stichprobe mindestens \(\pm0.232\) betragen müssen, um bei der Testung signifikant zu werden.



In einer Untersuchung bei Absolventinnen und Absolventen (\(n = 100\)) einer Berliner Universität beträgt die Korrelation zwischen der Uni-Abschlussnote und der Abiturnote \(r = 0.42\). Es soll überprüft werden, ob die Absolventinnen und Absolventen in Bezug auf den untersuchten Merkmalszusammenhang zu einer Grundgesamtheit, in der eine Korrelation \(\rho_0 = 0.50\) gilt, zählen.

(a) Prüfe zweiseitig und mit einer Irrtumswahrscheinlichkeit von \(\alpha=.05\) und fülle die nachfolgenden Lücken aus!

\(H_0\): _______________
\(H_1\): _______________
Prüfgröße: _______________
kritischer Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________


Lösungsansatz
  • den 1-Stichprobentest \(\boldsymbol{H_0}\): \(\boldsymbol{\rho=\rho_0}\) durchführen
  • Korrelationen Z-transformieren
  • Prüfgröße berechnen \[z = \sqrt{n-3}\cdot (Z-Z_0)\]
  • den kritischen Wert in der Tabelle der \(z\)-Verteilung nachschauen
  • die Prüfgröße mit dem kritischen Wert vergleichen und Testentscheidung treffen



Lösung
  • die Fragestellung hier lautet: Unterscheidet sich die Stichprobe der Absolventinnen und Absolventen einer Berliner Uni in Bezug auf den Zusammenhang zwischen Uni-Abschlussnote und Abiturnote von einer Population (= Grundgesamtheit) mit \(\rho_0=0.50\) für diesen Zusammenhang?
  • Wir vergleichen den Wert einer Stichprobe mit dem Populationswert
  • 1-Stichprobentest fur \(\boldsymbol{H_0}\): \(\boldsymbol{\rho=\rho_0}\)
  • \(H_0: \rho = 0.50\), \(H_1: \rho \neq 0.50\)
  • Prüfgröße berechnen:
    • Wir vergleichen zwei Korrelationen miteinander, deswegen brauchen wir die Fischer \(Z\)-Transformation der beiden Korrelationen \[Z_0 = \frac{1}{2}\cdot\ln{\frac{1+0.50}{1-0.50}} \approx 0.549\] \[Z = \frac{1}{2}\cdot\ln{\frac{1+0.42}{1-0.42}} \approx 0.448\]
    • dann kann die Prüfgröße selbst berechnet werden: \[z = \sqrt{n-3}\cdot (Z-Z_0) = \sqrt{100-3}\cdot (0.448-0.549) \approx -1.001\]
  • den kritischen Wert bestimmen:
    • wir testen zweiseitig: wir wollen feststellen, ob sich die Korrelation in der Stichprobe signifikant von der in der Population unterscheidet.
    • wir schauen in der Tabelle der \(z\)-Verteilung für \(z_{97,5\%}\) nach:
    • \(z_{97.5\%} = \pm 1.96\)
  • jetzt vergleichen wir die Prüfgröße mit dem kritischen Wert: \[z_{krit} = \pm 1.96 > |-1.001|\]
  • der Betrag der Prüfgröße ist kleiner als der kritische Wert \(\Rightarrow\) die Nullhypothese, dass die Stichprobenkorrelation mit der Populationskorrelation übereinstimmt, wird beibehalten
  • dabei können wir den \(\beta\)-Fehler begehen, d.h. die Nullhypothese zu Unrecht beibehalten

\(H_0\): \(\boldsymbol{\rho = 0.50}\)
\(H_1\): \(\boldsymbol{\rho \neq 0.50}\)
Prüfgröße: \(\boldsymbol{-1.001}\)
kritischer Wert: \(\boldsymbol{z_{97.5\%} = \pm 1.96}\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler


(b) Als Ergebnis sollen die Forscher die empirische Korrelation zusammen mit dem zugehörigen 95%-Konfidenzintervall berichten. Berechne dieses Konfidenzintervall!


Lösungsansatz
  • Konfidenzintervallgrenzen für den nach Fisher \(Z\)-transformierten Wert berechnen:
  • die Konfidenzintervallgrenzen für die Korrelationen berechnen (Transformation der \(Z\)-Werte in \(r\)-Äquivalente).
    Beachte: nicht symmetrisch!



Lösung
  • Zuerst \(Z\)-transformieren wir die gefundene empirische Korrelation \(r=0.42\):

\[Z = \frac{1}{2}\cdot\ln{\frac{1+0.42}{1-0.42}} \approx 0.448\]

  • Dann berechnen wir die Konfidenzintervallgrenzen für den nach Fisher \(Z\)-transformierten Wert mit Hilfe der folgenden Formel:

\[ Z \pm z_{1-\frac{\alpha}{2}} \cdot \frac{1}{\sqrt{n-3}}\]

  • Dafür brauchen wir den zweiseitigen kritischen \(z\)-Wert für 95%-KI: \(z_{97.5\%}= 1.96\) und die Stichprobengröße (N=100 aus der Aufgabe a))

  • Wir berechnen die Grenzen des KI:

    • obere Grenze: \(0.448 + 1.96 \cdot \frac{1}{\sqrt{100-3}} = 0.647\)
    • untere Grenze: \(0.448 - 1.96 \cdot \frac{1}{\sqrt{100-3}} = 0.249\)
  • Jetzt transformieren wir die \(Z\)-Werte in die \(r\)-Äquivalente und berechnen die Konfidenzintervallgrenzen für die Korrelationen:

\[r=\frac{e^{2\cdot Z}-1}{e^{2\cdot Z}+1}\]

  • untere Grenze: \(r_o=\frac{e^{2\cdot 0.249}-1}{e^{2\cdot 0.249}+1} \approx 0.244\)
  • obere Grenze: \(r_u=\frac{e^{2\cdot 0.647}-1}{e^{2\cdot 0.647}+1} \approx 0.570\)

Das 95%-Konfidenzintervall beträgt \([0.244; 0.570]\). Auch daran sehen wir, dass die empirische Korrelation \(r=0.42\) nicht signifikant unterschiedlich von \(\rho_0=0.50\) ist, da das KI den Populationsparameter umschließt.



In zwei unabhängigen Untersuchungen frisch (Gr. \(1\)) und schon mindestens \(20\) Jahre (Gr. \(2\)) verheirateter Ehepaare (\(n_1 = 50, n_2 = 60\)) wurde die Ähnlichkeit der beiden Partner in einem Interessentest untersucht. Die beiden gefundenen Korrelationen betrugen \(r_1 = 0.30\) und \(r_2 = 0.55\).

(a) Ist der Unterschied zwischen den Korrelationen bei zweiseitigem Test mit einem \(\alpha = .05\) statistisch signifikant? Fülle die nachfolgenden Lücken aus!

\(H_0\): _______________
\(H_1\): _______________
Prüfgröße: _______________
kritischer Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________


Lösungsansatz
  • den Test für zwei voneinander unabhängige Stichproben durchführen
  • Korrelationen Z-transformieren
  • Prüfgröße berechnen \[z = \frac{Z_1-Z_2}{\sqrt{\frac{1}{n_1-3} + \frac{1}{n_2-3}}}\]
  • den kritischen Wert in der Tabelle der \(z\)-Verteilung nachschauen
  • die Prüfgröße mit dem kritischen Wert vergleichen und Testentscheidung treffen



Lösung
  • Die Fragestellung hier lautet: wir wollen testen, ob sich zwei Korrelationen, die für zwei voneinander unabhängige Stichproben mit den Umfangen \(n_1\) und \(n_2\) ermittelt wurden, signifikant unterscheiden.
  • \(H_0: \rho_1 = \rho_2\)
  • \(H_1: \rho_1 \neq \rho_2\) (ungerichtet)
  • Prüfgröße berechnen:
    • Wir vergleichen zwei Korrelationen miteinander, deswegen brauchen wir die Fischer \(Z\)-Transformation der beiden Korrelationen \[Z_1 = \frac{1}{2}\cdot\ln{\frac{1+0.30}{1-0.30}} \approx 0.310\] \[Z_2 = \frac{1}{2}\cdot\ln{\frac{1+0.55}{1-0.55}} \approx 0.618\]
    • dann kann die Prüfgröße selbst berechnet werden: \[z = \frac{Z_1-Z_2}{\sqrt{\frac{1}{n_1-3} + \frac{1}{n_2-3}}} = \frac{0.310-0.618}{\sqrt{\frac{1}{50-3} + \frac{1}{60-3}}} \approx -1.563\]
  • den kritischen Wert bestimmen:
    • wir testen zweiseitig: wir wollen feststellen, ob sich die Korrelation in der Stichprobe signifikant von der in der Population unterscheidet.
    • wir schauen in der Tabelle der \(z\)-Verteilung für \(z_{97.5\%}\) nach:
    • \(z_{97.5\%} = \pm 1.96\)
  • jetzt vergleichen wir die Prüfgröße mit dem kritischen Wert: \[z_{krit} = \pm 1.96 > |-1.563|\]
  • der Betrag der Prüfgröße ist kleiner als der kritische Wert \(\Rightarrow\) die Nullhypothese, dass die Stichprobenkorrelation mit der Populationskorrelation übereinstimmt, wird beibehalten
  • dabei können wir den \(\beta\)-Fehler begehen, d.h. die Nullhypothese zu Unrecht beibehalten

\(H_0\): \(\boldsymbol{\rho_1 = \rho_2}\)
\(H_1\): \(\boldsymbol{\rho_1 \neq \rho_2}\)
Prüfgröße: \(\boldsymbol{-1.563}\)
kritischer Wert: \(\boldsymbol{z_{97.5\%} = \pm 1.96}\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler


Spezielle Korrelationstechniken

Die folgenden Eigenschaften werden in folgender Weise gemessen:

  • Geschlecht: 0 = männlich, 1 = weiblich
  • Neurotizismus: intervallskalierte Werte
  • sozialer Status in der Gruppe: ordinalskalierte Werte
  • Schulabschluss: mit Abitur = 1, ohne Abitur = 0

Mit welchen Verfahren können die Zusammenhänge zwischen folgenden Merkmalen quantifiziert werden?

  1. Geschlecht-Neurotizismus
  2. Geschlecht-Schulabschluss
  3. Nerotizismus – sozialer Status
  4. Geschlecht – sozialer Status
  5. Schulabschluss – sozialer Status

Lösung

Um richtige Verfahren für die Messung der jeweiligen Zusammenhänge zu ermitteln, sollten wir uns an die Tabelle aus der Vorlesung erinnern, in der die die Korrelationsverfahren in Abhängigkeit von den Skalenniveaus der beiden zu korrelierenden Variablen angegeben wurden.

Jetzt sollen wir die Skalenniveaus der Variablen jeweils in der Tabelle nachschauen und die passende Korrelationstechnik bestimmen:

  1. Geschlecht-Neurotizismus: Wir wollen die Korrelation einer dichotomen Variablen mit einer intervallskalierten Variablen bestimmen \(\rightarrow\) punktbiseriale Korrelation
  2. Geschlecht-Schulabschluss: Hier bestimmen wir die Korrelation zweier dichotomen Variablen \(\rightarrow\) Phi-Koeffizient
  3. Nerotizismus – sozialer Status: Dies ist eine Korrelation einer intervallskalierten mit einer ordinalskalierten Variablen \(\rightarrow\) Rangkorrelation
  4. Geschlecht – sozialer Status: Hier korrelieren wir eine dichotome Variable mit einer ordinalskalierten Variablen \(\rightarrow\) biseriale Rangkorrelation
  5. Schulabschluss – sozialer Status: Das ist wieder eine Korrelation zwischen einer dichotomen Variable und einer ordinalskalierten Variablen \(\rightarrow\) biseriale Rangkorrelation