Kovarianz, Produkt-Moment Korrelation und Transformation

(a)

Gegeben sind die beiden folgenden Messwertreihen zzgl. einiger deskriptiver Kennzahlen:
\(x: 2, 6, 10; \bar{x} = 6, {s_x}^2 = 16\)
\(y: 7, 5, 3; \bar{y}= 5, {s_y}^2 = 4\)

Berechne die Kovarianz \(s_{xy}\) und die Produkt-Moment-Korrelation \(r_{xy}\).


Lösung

Berechnung der Kovarianz:

  • zuerst werden die Abweichungen der einzelnen Messwerte von dem jeweiligen Mittelwert berechnet
  • dann sollten die Abweichungsprodukte der Messwertepaare berechnet werden:
x-Werte y-Werte \((x_i-\bar{x})\) \((y_i-\bar{y})\) \((x_i-\bar{x})(y_i-\bar{y})\)
2 7 \(2-6=-4\) \(7-5=2\) \(-4\cdot2\)
6 5 \(6-6=0\) \(5-5=0\) \(0\)
10 3 \(10-6=4\) \(3-5=-2\) \(4\cdot(-2)\)
  • dabei sollte man die Messwertpaare einhalten, d.h. zu \(x_1\) \(y_1\) und zu \(x_2\) \(y_2\) nehmen
  • Dann wird die Summe der Abweichungsprodukte gebildet \[\sum_{i=1}^n (x_i- \bar{x})\cdot(y_i- \bar{y})=(2-6)\cdot(7-5) \\ +(6-6)\cdot(5-5)+(10-6)\cdot(3-5)=16\]
  • danach teilt man die Summe der Abweichungsprodukte durch \(n-1\), wobei \(n\) die Anzahl der Messwertepaare ist \[s_{xy}=\frac {\sum_{i=1}^n (x_i- \bar{x})\cdot(y_i- \bar{y})}{n-1}=\frac {16}{3-1}=\underline{\underline{-8}}\]

Berechnung der Produkt-Moment Korrelation:

  • man teilt die erhaltene Kovarianz \(s_{xy}\) durch das Produkt der Varianzen \(s_x\) und \(s_y\) \[r_{xy}=\frac {s_{xy}}{s_x \cdot s_y}=\frac {-8}{\sqrt{16} \cdot \sqrt{4}}=\underline{\underline{-1}}\]


(b) Welche Aussage ist falsch?

  1. Die Korrelation \(r_{xy}\) ändert sich nicht, wenn jeder Wert von \(x\) mit \(a^2\) multipliziert wird.
  2. Die Korrelation \(r_{xy}\) ändert sich, wenn jeder Wert von \(y\) quadriert wird.
  3. Die Korrelation \(r_{xy}\) ändert sich, wenn der erste und letzte Wert von \(x\) vertauscht werden.
  4. Die Korrelation \(r_{xy}\) ändert sich, wenn jeder Wert von \(x\) und \(y\) \(z\)-transformiert wird.

Lösung

  1. Die Korrelation \(r_{xy}\) ändert sich nicht, wenn jeder Wert von \(x\) mit \(a^2\) multipliziert wird.
    RICHTIG. Korrelationen sind invariant gegenüber linearen Transformationen \(u = a + b\cdot{x}\). Hier ist \(a=0\), \(b=a^2\).
  2. Die Korrelation \(r_{xy}\) ändert sich, wenn jeder Wert von \(y\) quadriert wird.
    RICHTIG. Korrelationen sind nur invariant gegenüber linearen Transformationen. Quadrieren ist keine lineare Transformation.
  3. Die Korrelation \(r_{xy}\) ändert sich, wenn der erste und letzte Wert von \(x\) vertauscht werden.
    RICHTIG. Korrelationen sind nur invariant gegenüber linearen Transformationen. Messwertpaare müssen beibehalten werden.
  4. Die Korrelation \(r_{xy}\) ändert sich, wenn jeder Wert von \(x\) und \(y\) \(z\)-transformiert wird.
    FALSCH. Korrelationen sind invariant gegenüber linearen Transformationen wie der \(z\)-Transformation.


(c) Welche Aussage ist korrekt?

  1. Die Kovarianz ist ein standardisiertes Zusammenhangsmaß, welches zur Beschreibung von linearen Zusammenhängen verwendet wird.
  2. Im Gegensatz zur Kovarianz kann die Korrelation nicht nur lineare sondern auch andere Zusammenhänge beschreiben. Daher eignet sich die Korrelation auch besser als Zusammenhangsmaß.
  3. Bei einem perfekten linearen Zusammenhang zwischen \(x\) und \(y\) liegen alle Punkte im Streudiagramm auf einer Geraden.
  4. Der Korrelationskoeffzient \(r\) ist die Kovarianz geteilt durch die Varianz von \(x\) und \(y\).

Lösung

  1. Die Kovarianz ist ein standardisiertes Zusammenhangsmaß, welches zur Beschreibung von linearen Zusammenhängen verwendet wird.
    FALSCH, die Kovarianz ist ein nicht-standardisiertes Zusammenhangsmaß.
  2. Im Gegensatz zur Kovarianz kann die Korrelation nicht nur lineare sondern auch andere Zusammenhänge beschreiben. Daher eignet sich die Korrelation auch besser als Zusammenhangsmaß.
    FALSCH, Korrelation beschreibt, genauso wie die Kovarianz, lineare Zusammenhänge.
  3. Bei einem perfekten linearen Zusammenhang zwischen \(x\) und \(y\) liegen alle Punkte im Streudiagramm auf einer Geraden.
    RICHTIG. Das werden wir uns im Rahmen der linearen Regression nochmal genauer ansehen. Erstmal aber: je enger der Zusammenhang, desto weniger ähnelt sich das Muster, in dem die Messwerte im Streudiagramm liegen, einem Kreis.
  4. Der Korrelationskoeffzient \(r\) ist die Kovarianz geteilt durch die Varianz von \(x\) und \(y\).
    FALSCH, \(r\) ist de Kovarianz geteilt durch das Produkt der Standardabweichungen von \(x\) und \(y\).


Fisher \(Z\)-Transformation

In zwei Untersuchungen wurden folgende Zusammenhange zwischen zwei psychologischen Variablen gefunden:

\(r_1 = .50; r_2 = .80\).

Wie lautet der durchschnittliche Korrelationskoeffzient, wenn wir davon ausgehen können, dass die untersuchten Stichproben gleich groß waren?
Lösung

  • als Erstes sollte man die \(r\)-Werte in \(Z\)-Werte umrechnen, da die Abstände bei \(r\)-Werten im Gegensatz zu \(Z\)-Werten nicht interpretierbar sind: \[Z = \frac{1}{2}\cdot\ln{\frac{1+r}{1-r}}\] \[Z_1 = \frac{1}{2}\cdot\ln{\frac{1+0.50}{1-0.50}} \approx 0.549\] \[Z_2 = \frac{1}{2}\cdot\ln{\frac{1+0.80}{1-0.80}} \approx 1.099\]
  • danach mittelt man die \(Z\)-Werte \[\bar{Z}=\frac{Z_1+Z_2}{2} = \frac{0.549+1.099}{2}=0.824\]
  • den erhaltenen \(Z\)-Wert sollte man rücktransformieren in einen \(r\)-Wert \[\bar{r} = \frac{e^{2\cdot Z}-1}{e^{2\cdot Z}+1}= \frac{e^{2\cdot 0.824}-1}{e^{2\cdot 0.824}+1} \approx \underline{\underline{0.68}}\]


Prüfung von Korrelationshypothesen

(a)

In einer Untersuchung zur Qualität sozialer Beziehungen im jungen Erwachsenenalter wurde ein schwach negativer linearer Zusammenhang zwischen wahrgenommener Unsicherheit und Kontakthäufigkeit von \(r = -.15\) gefunden. Insgesamt bestand die repräsentative Stichprobe aus \(n = 122\) Personen.

Prüfe zweiseitig und mit einer Irrtumswahrscheinlichkeit von \(\alpha=.01\), ob der gefundene Zusammenhang statistisch signifikant ist und fülle die nachfolgenden Lücken aus!

\(H_0\): _______________
\(H_1\): _______________
Prüfgröße: _______________
kritischer Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________


Lösungsansatz

  • den 1-Stichprobentest mit \(H_0: \rho = 0\) durchführen
  • Prüfgröße berechnen \[t = \frac{r\cdot \sqrt{n-2}}{\sqrt{1-r^2}}\]
  • Freiheitsgrade berechnen \[df = n-2\]
  • den kritischen Wert in der Tabelle der \(t\)-Verteilung nachschauen
  • die Prüfgröße mit dem kritischen Wert vergleichen und Testentscheidung treffen



Lösung

  • die Fragestellung hier lautet: Weicht die empirisch ermittelte Korrelation \(r =-.15\) signifikant von der Annahme ab, dass kein linearer Zusammenhang zwischen den untersuchten Variablen in der Population besteht?

  • es wird nur eine Stichprobe untersucht

  • 1-Stichprobentest mit \(H_0: \rho = 0\) und \(H_1: \rho \neq 0\) (erschöpfend formuliert)

  • Prüfgröße berechnen: \[t = \frac{r\cdot \sqrt{n-2}}{\sqrt{1-r^2}} = \frac{-.15\cdot \sqrt{122-2}}{\sqrt{1-(-.15)^2}} \approx \underline{\underline{-1.662}}\]

  • kritischen Wert bestimmen:

    • zuerst dazugehörige Freiheitsgrade berechnen: \[df = n-2=122-2=120\]
    • wir testen zweiseitig: wir wollen feststellen, ob sich die Korrelation in der Stichprobe signifikant von der in der Population unterscheidet.
    • dafür sollten wir das Signifikanzniveau \(\boldsymbol{\alpha}\) durch \(\boldsymbol{2}\) teilen: wir wollen uns die beiden Seiten der Verteilung anschauen
    • somit brauchen wir einen kritischen Wert für \(1- \frac{0.01}{2} = 1-0.005 = 0.995 = 99.5\%\)
    • wir schauen in der Tabelle der \(t\)-Verteilung für \(t_{120;99,5\%}\) nach:

  • kritischer Wert: \(t_{120;99,5\%} = \underline{\underline{\pm 2.62}}\)

  • jetzt vergleichen wir die Prüfgröße mit dem kritischen Wert: \[t_{krit} = \pm 2.62> |-1.662|\]

  • der Betrag der Prüfgröße ist kleiner als der kritische Wert \(\Rightarrow\) die Nullhypothese, dass die Stichprobenkorrelation mit der Populationskorrelation übereinstimmt, wird beibehalten

  • dabei können wir den \(\boldsymbol{\beta}\)-Fehler begehen, d.h. die Nullhypothese zu Unrecht beibehalten

\(H_0\): \(\boldsymbol{\rho = 0}\)
\(H_1\): \(\boldsymbol{\rho \neq 0}\)
Prüfgröße: \(\boldsymbol{-1.662}\) mit \(\boldsymbol{df = 120}\)
kritischer Wert: \(\boldsymbol{t_{120; 99.5\%} = \pm 2.62}\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler


(b)

In einer Untersuchung bei Absolventen (\(n = 100\)) einer Berliner Universität beträgt die Korrelation zwischen der Uni-Abschlussnote und der Abiturnote \(r = 0.42\). Es soll überprüft werden, ob die Absolventen in Bezug auf den untersuchten Merkmalszusammenhang zu einer Grundgesamtheit, in der eine Korrelation \(\rho_0 = 0.50\) gilt, zählen.

Prüfe zweiseitig und mit einer Irrtumswahrscheinlichkeit von \(\alpha=.05\) und fülle die nachfolgenden Lücken aus!

\(H_0\): _______________
\(H_1\): _______________
Prüfgröße: _______________
kritischer Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________


Lösungsansatz

  • den 1-Stichprobentest \(\boldsymbol{H_0}\): \(\boldsymbol{\rho=\rho_0}\) durchführen
  • Korrelationen Z-transformieren
  • Prüfgröße berechnen \[z = \sqrt{n-3}\cdot (Z-Z_0)\]
  • den kritischen Wert in der Tabelle der \(z\)-Verteilung nachschauen
  • die Prüfgröße mit dem kritischen Wert vergleichen und Testentscheidung treffen



Lösung

  • die Fragestellung hier lautet: Unterscheidet sich die Stichprobe der Absolventen einer Berliner Uni in Bezug auf den Zusammenhang zwischen Uni-Abschlussnote und Abiturnote von einer Population (= Grundgesamtheit) mit \(\rho_0=0.50\) für diesen Zusammenhang?
  • Wir vergleichen den Wert einer Stichprobe mit dem Populationswert
  • 1-Stichprobentest fur \(\boldsymbol{H_0}\): \(\boldsymbol{\rho=\rho_0}\)
  • \(H_0: \rho = 0.50\), \(H_1: \rho \neq 0.50\)
  • Prüfgröße berechnen:
    • Wir vergleichen zwei Korrelationen miteinander, deswegen brauchen wir die Fischer \(Z\)-Transformation der beiden Korrelationen \[Z_0 = \frac{1}{2}\cdot\ln{\frac{1+0.50}{1-0.50}} \approx 0.549\] \[Z = \frac{1}{2}\cdot\ln{\frac{1+0.42}{1-0.42}} \approx 0.448\]
    • dann kann die Prüfgröße selbst berechnet werden: \[z = \sqrt{n-3}\cdot (Z-Z_0) = \sqrt{100-3}\cdot (0.448-0.549) \approx \underline{\underline{-1.001}}\]
  • den kritischen Wert bestimmen:
    • wir testen zweiseitig: wir wollen feststellen, ob sich die Korrelation in der Stichprobe signifikant von der in der Population unterscheidet.
    • wir schauen in der Tabelle der \(z\)-Verteilung für \(z_{97,5\%}\) nach:
    • \(z_{97.5\%} = \underline{\underline{\pm 1.96}}\)
  • jetzt vergleichen wir die Prüfgröße mit dem kritischen Wert: \[z_{krit} = \pm 1.96 > |-1.001|\]
  • der Betrag der Prüfgröße ist kleiner als der kritische Wert \(\Rightarrow\) die Nullhypothese, dass die Stichprobenkorrelation mit der Populationskorrelation übereinstimmt, wird beibehalten
  • dabei können wir den \(\boldsymbol{\beta}\)-Fehler begehen, d.h. die Nullhypothese zu Unrecht beibehalten

\(H_0\): \(\boldsymbol{\rho = 0.50}\)
\(H_1\): \(\boldsymbol{\rho \neq 0.50}\)
Prüfgröße: \(\boldsymbol{-1.001}\)
kritischer Wert: \(\boldsymbol{z_{97.5\%} = \pm 1.96}\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler


(c)

In zwei unabhängigen Untersuchungen frisch (Gr. \(1\)) und schon mindestens \(20\) Jahre (Gr. \(2\)) verheirateter Ehepaare (\(n_1 = 50, n_2 = 60\)) wurde die Ähnlichkeit der beiden Partner in einem Interessentest untersucht. Die beiden gefundenen Korrelationen betrugen \(r_1 = 0.30\) und \(r_2 = 0.55\).

Ist der Unterschied zwischen den Korrelationen bei zweiseitigem Test mit einem \(\alpha = .05\) statistisch signifikant? Fülle die nachfolgenden Lücken aus!

\(H_0\): _______________
\(H_1\): _______________
Prüfgröße: _______________
kritischer Wert: _______________
Testentscheidung: Die \(H_0\) wird _______________
möglicher Fehler nach erfolgter Testentscheidung: _______________


Lösungsansatz

  • den Test für zwei voneinander unabhängige Stichproben durchführen
  • Korrelationen Z-transformieren
  • Prüfgröße berechnen \[z = \frac{Z_1-Z_2}{\sqrt{\frac{1}{n_1-3} + \frac{1}{n_2-3}}}\]
  • den kritischen Wert in der Tabelle der \(z\)-Verteilung nachschauen
  • die Prüfgröße mit dem kritischen Wert vergleichen und Testentscheidung treffen



Lösung

  • Die Fragestellung hier lautet: wir wollen testen, ob sich zwei Korrelationen, die für zwei voneinander unabhängige Stichproben mit den Umfangen \(n_1\) und \(n_2\) ermittelt wurden, signifikant unterscheiden.
  • \(H_0: \rho_1 = \rho_2\)
  • \(H_1: \rho_1 \neq \rho_2\) (ungerichtet)
  • Prüfgröße berechnen:
    • Wir vergleichen zwei Korrelationen miteinander, deswegen brauchen wir die Fischer \(Z\)-Transformation der beiden Korrelationen \[Z_1 = \frac{1}{2}\cdot\ln{\frac{1+0.30}{1-0.30}} \approx 0.310\] \[Z_2 = \frac{1}{2}\cdot\ln{\frac{1+0.55}{1-0.55}} \approx 0.618\]
    • dann kann die Prüfgröße selbst berechnet werden: \[z = \frac{Z_1-Z_2}{\sqrt{\frac{1}{n_1-3} + \frac{1}{n_2-3}}} = \frac{0.310-0.618}{\sqrt{\frac{1}{50-3} + \frac{1}{60-3}}} \approx \underline{\underline{-1.563}}\]
  • den kritischen Wert bestimmen:
    • wir testen zweiseitig: wir wollen feststellen, ob sich die Korrelation in der Stichprobe signifikant von der in der Population unterscheidet.
    • wir schauen in der Tabelle der \(z\)-Verteilung für \(z_{97.5\%}\) nach:
    • \(z_{97.5\%} = \underline{\underline{\pm 1.96}}\)
  • jetzt vergleichen wir die Prüfgröße mit dem kritischen Wert: \[z_{krit} = \pm 1.96 > |-1.563|\]
  • der Betrag der Prüfgröße ist kleiner als der kritische Wert \(\Rightarrow\) die Nullhypothese, dass die Stichprobenkorrelation mit der Populationskorrelation übereinstimmt, wird beibehalten
  • dabei können wir den \(\boldsymbol{\beta}\)-Fehler begehen, d.h. die Nullhypothese zu Unrecht beibehalten

\(H_0\): \(\boldsymbol{\rho_1 = \rho_2}\)
\(H_1\): \(\boldsymbol{\rho_1 \neq \rho_2}\)
Prüfgröße: \(\boldsymbol{-1.563}\)
kritischer Wert: \(\boldsymbol{z_{97.5\%} = \pm 1.96}\)
Testentscheidung: Die \(H_0\) wird beibehalten.
möglicher Fehler nach erfolgter Testentscheidung: \(\boldsymbol{\beta}\)-Fehler