Skalenniveaus

(1) Die Angabe der Religionszugehörigkeit (Islam/ Judentum/ Christentum/ Hinduismus etc.) wird in ein numerisches Relativ übertragen, indem jeder Religion ein Wert zugeordnet wird. Welche der folgenden Aussagen trifft zu?

  1. Die Rangfolge und die Differenzen zwischen den Werten sind sinnvoll interpretierbar
  2. Es existiert ein absoluter Nullpunkt, der sinnvoll interpretierbar ist
  3. Es können Aussagen über Häufigkeiten getroffen werden
  4. Es dürfen keine Transformationen der Werte vorgenommen werden

(2) Welche Aussage über die Angabe des Studienabschlusses (kein Abschluss/ Bachelor/ Master/ PhD etc.) trifft zu?

  1. Der Abstand zwischen zwei Abschlüssen A und B ist nicht sinnvoll interpretierbar
  2. Es gibt einen sinnvoll interpretierbaren Nullpunkt
  3. Aussagen über Häufigkeit und Rangordnung sind unzulässig
  4. Der Modus kann nicht berechnet werden

(3) Welche Aussage über die Angabe der Temperatur in Grad Fahrenheit ist falsch?

  1. Der Abstand zwischen zwei Temperaturwerten A und B kann sinnvoll interpretiert werden
  2. Der absolute Nullpunkt ist sinnvoll interpretierbar
  3. Bei Transformationen der Werte (z.B. zu Grad Celsius) ist zu beachten, dass Differenzen im selben Verhältnis zueinander bleiben
  4. Bei mehreren vorliegenden Daten sind Mittelwert und Standardabweichung sinnvoll interpretierbar

(4) Welche Aussage über Angaben der Körpergröße (in cm) trifft zu?

  1. Der Abstand zwischen zwei Werten A und B ist nicht sinnvoll interpretierbar
  2. Der absolute Nullpunkt ist sinnvoll interpretierbar
  3. Transformationen jeglicher Art sind unzulässig
  4. Aussagen über Häufigkeiten sind unzulässig


Lösung

Bei den obigen Angaben handelt es sich um unterschiedliche Skalenniveaus:

  • Religionszugehörigkeit \(\rightarrow\) Nominalskalenniveau
  • Studienabschluss \(\rightarrow\) Ordinalskalenniveau
  • Grad Fahrenheit \(\rightarrow\) Intervallskalenniveau
  • Körpergröße \(\rightarrow\) Verhältnisskalenniveau

Dies wirkt sich darauf aus, welche Interpretationen und Transformationen zulässig sind:

Niveau Definiert Zulässige Transformationen Mittelwert
Nominal Häufigkeit sowie Gleichheit/ Ungleichheit Alle eineindeutigen Transformationen Modus
Ordinal zusätzlich: Rangordnung streng-monoton-steigende Transformationen zusätzlich: Median
Intervall zusätzlich: Differenzen/Abstände lineare Transformationen (\(y=a \cdot x+b\) ) zusätzlich: arithmetisches Mittel (Mittelwert)
Verhältnis zusätzlich: absoluter Nullpunkt sowie Quotienten/ Produkte proportionale Transformationen (\(y=a \cdot x\)) zusätzlich: geometrisches Mittel

Dementsprechend ergeben sich folgende Lösungen:

(1) Die Angabe der Religionszugehörigkeit (Islam/ Judentum/ Christentum/ Hinduismus etc.) wird in ein numerisches Relativ übertragen, indem jeder Religion ein Wert zugeordnet wird. Welche der folgenden Aussagen trifft zu?

  1. Die Rangfolge und die Differenzen zwischen den Werten sind sinnvoll interpretierbar
  2. Es existiert ein absoluter Nullpunkt, der sinnvoll interpretierbar ist
  3. Es können Aussagen über Häufigkeiten getroffen werden 🗸
  4. Es dürfen keine Transformationen der Werte vorgenommen werden

(2) Welche Aussage über die Angabe des Studienabschlusses (kein Abschluss/ Bachelor/ Master/ PhD etc.) trifft zu?

  1. Der Abstand zwischen zwei Abschlüssen A und B ist nicht sinnvoll interpretierbar 🗸
  2. Es gibt einen sinnvoll interpretierbaren Nullpunkt
  3. Aussagen über Häufigkeit und Rangordnung sind unzulässig
  4. Der Modus kann nicht berechnet werden

(3) Welche Aussage über die Angabe der Temperatur in Grad Fahrenheit ist falsch?

  1. Der Abstand zwischen zwei Temperaturwerten A und B kann sinnvoll interpretiert werden
  2. Der absolute Nullpunkt ist sinnvoll interpretierbar X
  3. Bei Transformationen der Werte (z.B. zu Grad Celsius) ist zu beachten, dass Differenzen im selben Verhältnis zueinander bleiben
  4. Bei mehreren vorliegenden Daten sind Mittelwert und Standardabweichung sinnvoll interpretierbar

(4) Welche Aussage über Angaben der Körpergröße (in cm) trifft zu?

  1. Der Abstand zwischen zwei Werten A und B ist nicht sinnvoll interpretierbar
  2. Der absolute Nullpunkt ist sinnvoll interpretierbar 🗸
  3. Transformationen jeglicher Art sind unzulässig
  4. Aussagen über Häufigkeiten sind unzulässig


Zufallsverteilungen und Intervalle

(1) Bei welcher Verteilung handelt es sich um eine Standardnormalverteilung?

  1. F- Verteilung
  2. t- Verteilung
  3. Binomialverteilung
  4. z-Verteilung

Lösung
  1. F- Verteilung
    Bei der F-Verteilung handelt es sich um eine asymmetrische Verteilung.
  2. t- Verteilung
    Die t-Verteilung ist in den Enden breiter als die Standardnormalverteilung. Mit zunehmenden Freiheitsgraden, nähert sie sich jedoch einer Standardnormalverteilung an.
  3. Binomialverteilung
    Die Binomialverteilung ist keine kontinuierliche sondern eine diskrete Verteilung.
  4. z-Verteilung 🗸

Die Standardnormalverteilung zeichnet sich dadurch aus, dass ihr Mittelwert immer 0 und die Standardabweichung immer 1 ist.

Durch die z-Transformation lässt sich jede Rohwertenormalverteilung mit den bekannten Parametern \(\mu\) und \(\sigma\) in die Standardnormalverteilung transformieren:

\[z=\frac{x-\mu}{\sigma}\]



(2) Der Intelligenzquotient sei normalverteilt mit μ = 100 und σ = 15. Wie wahrscheinlich ist es, dass jemand einen Wert von 130 Punkten oder höher erzielt?


Lösungsansatz

1. Rohwert in einen z-Wert transformieren: \[z=\frac{x-\mu}{\sigma}\]

2. Zu dem z-Wert/Perzentil gehörige Wahrscheinlichkeit in der z-Werte-Tabelle ablesen:


Lösung

Standardvorgehen bei Berechnung der Fläche unterhalb eines bestimmten Werts:

1. Rohwert in einen z-Wert transformieren: \[z=\frac{130-100}{15}=2\]

2. Zugehörige Wahrscheinlichkeit in der z-Werte-Tabelle ablesen:

Unterhalb des z-Wertes von \(z=2\) liegen 97.72% der Verteilung.

Da wir aber die Wahrscheinlichkeit, dass ein IQ von mindestens 130 Punkten erzielt wird, herausfinden möchten, interessieren wir uns für die Fläche rechts des z-Werts. Weil die Fläche unter der Normalverteilung 1 ist, können wir also die Wahrscheinlichkeit, oberhalb dieses Wertes zu liegen, folgendermaßen berechnen: \[1-0.9772=0.0228\]

Die Wahrscheinlichkeit, dass jemand einen IQ-Wert von 130 Punkten oder höher erzielt, beträgt 2.28%.


Hypothesentestung

(1) Finde die passenden Begriffe für den Lückentext.

Die ___________-hypothese bezieht sich im Allgemeinen auf das statistische Modell, welches einer Prüfung unterzogen werden soll, z.B. dass es in der Population keinen Unterschied zwischen zwei Gruppenmitteln gibt.

__________-hypothesen unterscheidet man bezüglich der Richtung und der Spezifität. Nimmt das Effektmaß bei der Alternativhypothese eine ganz bestimmte Größe an, spricht man von einer __________ Hypothese, während bei einer __________ keine Effektgröße spezifiziert ist.

Unter den gerichteten Alternativhypothesen unterscheidet man die linksseitigen von den rechtsseitigen. Bei __________-seitigen Hypothesen schließt die Alterativhypothese kleinere Effektwerte ein als die Nullhypothese. Bei __________-seitigen Hypothesen hingegen schließt die Alternativhypothese größere Effektwerte ein als die Nullhypothese.


Lösung

Die Null-hypothese bezieht sich im Allgemeinen auf das statistische Modell, welches einer Prüfung unterzogen werden soll, z.B. dass es in der Population keinen Unterschied zwischen zwei Gruppenmitteln gibt.

Alternativ-hypothesen unterscheidet man bezüglich der Richtung und der Spezifität. Nimmt das Effektmaß bei der Alternativhypothese eine ganz bestimmte Größe an, spricht man von einer spezifischen Hypothese, während bei der unspezifischen Hypothese keine Effektgröße spezifiziert ist.

Unter den gerichteten Alternativhypothesen unterscheidet man die linksseitigen von den rechtsseitigen. Bei links-seitigen Hypothesen schließt die Alterativhypothese kleinere Effektwerte ein als die Nullhypothese. Bei rechts-seitigen Hypothesen hingegen schließt die Alternativhypothese größere Effektwerte ein als die Nullhypothese



(2) Vervollständigt die folgenden Angaben:

I. Verteilung der Prüfgröße unter der __________________

II. Hellblau schraffierte Fläche: ___________________

III. Dunkelblau schraffierte Fläche: ___________________

IV. Getroffene Testentscheidung: ____________________


Lösung

I. Verteilung der Prüfgröße unter der Nullhypothese

II. Blau schraffierte Fläche: p-Wert

III. Grün schraffierte Fläche: \(\alpha\)-Niveau

IV. Getroffene Testentscheidung: Beibehaltung der \(H_0\)



Testentscheidung
\(H_0\) beibehalten \(H_0\) abgelehnt
Population \(H_0\) gilt I.
Population \(H_0\) gilt nicht

(3) Um welche Fehlerarten handelt es sich?

I. ___________________________

II. ___________________________


Lösung

I. Fehler 1. Art (\(\alpha\))

II. Fehler 2. Art (\(\beta\))

Eselsbrücke:

\(\alpha\)blehnung der \(H_0\), obwohl diese in der Population gilt \(\rightarrow\) Fehler 1. Art (\(\alpha\))

\(\beta\)eibehaltung der \(H_0\), obwohl diese in der Population nicht gilt \(\rightarrow\) Fehler 2. Art (\(\beta\))



(4) Welche der folgenden Aussagen über Konfidenzintervalle treffen zu?

  1. Ein 95% Konfidenzintervall gibt uns Auskunft darüber, innerhalb welcher Grenzen der wahre Wert mit einer 95% Wahrscheinlichkeit liegt.
  2. Wenn eine unendliche Menge an Stichprobenziehungen vorliegt und bei diesen immer das 95%-Konfidenzintervall berechnet wird, überdecken 95% der errechneten Konfidenzintervalle den wahren Wert.
  3. Konfidenzintervalle sind mit einer größeren Unsicherheit als Punktschätzungen behaftet.

Lösung
  1. Ein 95% Konfidenzintervall gibt uns Auskunft darüber, innerhalb welcher Grenzen der wahre Wert mit einer 95% Wahrscheinlichkeit liegt.
    Diese Annahme ist wird oft fälschlicherweise getroffen. Jedoch stehen sowohl das berechnete Intervall als auch der wahre Wert fest und haben somit eine Wahrscheinlichkeit von 100%.
  2. Wenn eine unendliche Menge an Stichprobenziehungen vorliegt und bei diesen immer das 95%-Konfidenzintervall berechnet wird, überdecken 95% der errechneten Konfidenzintervalle den wahren Wert. 🗸
  3. Konfidenzintervalle sind mit einer größeren Unsicherheit als Punktschätzungen behaftet.
    Einzelne Punktschätzungen sind stark von Stichproben abhängig. Um diese Unsicherheit auszudrücken, werden Konfidenzintervalle berechnet. Sie erlauben es uns, die Unsicherheit unserer Punktschätzung zu quantifizieren und somit besser einschätzen zu können.



(5) Wir führen eine Hypothesentestung mit \(\alpha=0.05\) durch. Unser p-Wert beträgt \(p=0.0001\). Welche Aussage trifft zu?

  1. Wir verwerfen die \(H_0\).
  2. Die \(H_1\) ist wahr.
  3. Die \(H_1\) ist mit 95%iger Wahrscheinlichkeit zutreffend.
  4. Da der p-Wert wesentlich kleiner als α = 0.05 ist, können wir von einem starken Effekt ausgehen.

Lösung
  1. Wir verwerfen die \(H_0\) 🗸
    \(p < \alpha\)
  2. Die \(H_1\) ist wahr
    In der frequentistischen Inferenzstatistik können keine absoluten Aussagen über die Wahrheit von Hypothesen getroffen werden, sondern wir finden lediglich probabilistische Evidenz für Hypothesen anhand der Daten. Wir können deshalb immer nur Annahmen machen. Bsp.: “Wir gehen davon aus, dass die H1 zutrifft.”
  3. Die \(H_1\) ist mit 95%iger Wahrscheinlichkeit zutreffend
    In der frequentistischen Statistik werden keine Aussagen über die tatsächliche Wahrscheinlichkeit von Hypothesen getroffen (das machten wir nur in der bayesianischen Statistik). Wir kennen nur die Wahrscheinlichkeit, dass die Nullhypothese falsch ist, gegeben unsere Daten (unser p-Wert).
  4. Da der p-Wert wesentlich kleiner als α = 0.05 ist, können wir von einem starken Effekt ausgehen
    Die (statistische) Signifikanz eines Ergebnisses sagt nichts über die Größe der Unterschiede in der Population oder über die Sicherheit unserer Entscheidung aus.


Teststärke

(1) Was bezeichnet die Teststärke?

  1. Die Größe des gefundenen Effekts.
  2. Die Wahrscheinlichkeit, die Nullhypothese (zugunsten einer spezifischen \(H_1\)) abzulehnen, wenn diese tatsächlich falsch ist.
  3. Die Wahrscheinlichkeit, die Nullhypothese beizubehalten, wenn diese tatsächlich stimmt
  4. Die Wahrscheinlichkeit, den ß-Fehler zu begehen (d.h. die \(H_0\) beizubehalten, wenn diese jedoch falsch ist).

Lösung
  1. Die Größe des gefundenen Effekts.
  2. Die Wahrscheinlichkeit, die Nullhypothese (zugunsten einer spezifischen \(H_1\)) abzulehnen, wenn diese tatsächlich falsch ist. 🗸 \(\rightarrow\) …d.h., die Wahrscheinlichkeit, einen Effekt zu finden, wenn dieser tatsächlich vorliegt.
  3. Die Wahrscheinlichkeit, die Nullhypothese beizubehalten, wenn diese tatsächlich stimmt.
  4. Die Wahrscheinlichkeit, den ß-Fehler zu begehen (d.h. die \(H_0\) beizubehalten, wenn diese jedoch falsch ist).



(2) Ordne die folgenden Begriffe den korrekten Beschriftungen (I. bis V.) in der Grafik zu:

  • Effektgröße \(\delta\)
  • Fehler 2. Art (\(\beta\))
  • Fehler 1. Art (\(\alpha\))
  • \(1-\alpha\)
  • Teststärke (\(1-\beta\))

Lösung



(3) Welche Angabe trifft zu?

  1. Je kleiner das \(\alpha\)–Niveau, desto __________________ (größer/ kleiner) die Teststärke.
  2. Je größer die Effektgröße \(\delta\), desto ________________ (größer/ kleiner) die Teststärke.
  3. Je größer die Stichprobengröße \(N\), desto _______________ (größer/ kleiner) die Teststärke.

Lösung
  1. Je kleiner das \(\alpha\)–Niveau, desto kleiner die Teststärke.
  2. Je größer die Effektgröße \(\delta\), desto größer die Teststärke.
  3. Je größer die Stichprobengröße \(N\), desto größer die Teststärke.

Erklärung:

Anhand der Grafik aus der Lösung der Aufgabe 2) lassen sich einige Zusammenhänge bezüglich der Teststärke beschreiben:

  • Je größer \(\beta\) (der Fehler 2. Art), desto kleiner die Teststärke \(1-\beta\) \(\rightarrow\) Da \(\alpha\) und \(\beta\) komplementär sind, beeinflusst \(\alpha\) folglich auch indirekt die Teststärke: Je größer \(\alpha\), desto kleiner \(\beta\) und folglich desto größer die Teststärke.

  • \(\delta\) gibt die standardisierte Größe des Effekt an. Je größer die Effektgröße \(\delta\), desto “weiter” sind die Verteilungen der Prüfgröße unter der \(H_0\) und der \(H_1\) voneinander entfernt. \(\rightarrow\) Grafisch lässt sich hieran verdeutlichen: Je kleiner der Überlappungsbereich der Verteilungen von \(H_0\) und \(H_1\) (durch eine große Effektgröße), desto kleiner ist \(\beta\) und folglich desto größer die Teststärke.

Zudem gilt: Je größer der Stichprobenumfang N, desto genauer die Schätzung. Dementsprechend steigt die Wahrscheinlichkeit, einen Effekt zu detektieren, sofern ein solcher vorliegt (also die Teststärke).
Dies lässt sich auch grafisch erklären: je genauer die Schätzung, desto kleiner der Standardfehler. Somit wird die Verteilung schmaler, sodass entsprechend wieder ein kleinerer Überlappungsbereich von \(H_0\) und \(H_1\) entsteht.



(4) Welche Art der Poweranalyse müsste in Fall A und welche in Fall B berechnet werden?

gegeben gesucht
Fall A \(N\); Effektgröße \(\delta\); \(\alpha\)- Niveau \(1\) \(-\) \(\beta\)
Fall B \(1-\beta\); Effektgröße \(\delta\); \(\alpha\)- Niveau \(N\)

Lösung

Fall A: Post hoc Poweranalyse

  • Wie hoch war die Teststärke, die gegebene Effektgröße \(\delta\) bei dem festgelegten \(\alpha\)-Niveau mit unserer Stichprobe von \(n\) Personen zu detektieren?
  • Anhand dieser Berechnung kann herausgefunden werden, ob die Wahrscheinlichkeit, überhaupt einen Effekt zu finden, wenn dieser tatsächlich vorlag, groß genug war.

Fall B: A priori Poweranalyse

  • Welche Stichprobengröße \(n\) ist nötig, um eine bestimmte Effektgröße \(\delta\) bei einem bestimmten \(\alpha\)-Niveau mit der gewünschten Teststärke von \(1-ß\) detektieren zu können?
  • wird vorab (“a priori”) berechnet.
  • Diese Berechnung ist bei der Planung einer Erhebung hilfreich.


z-Test und t-Tests

(1) Bei welchen der folgenden beiden Untersuchungen sollte der z-Test und bei welcher der Ein-Stichproben-t-Test zur Auswertung verwendet werden?

  1. Ein Botaniker vermutet, dass die Blüten seiner neu entdeckten Pflanze überdurchschnittlich groß sind. Um seine Hypothese zu überprüfen, vergleicht er die durchschnittliche Größe von 10 dieser Blüten (\(\bar{x}=10\) cm, \(s=3\) cm) mit den Normwerten für Pflanzen dieser Region (\(\mu=8\) cm, \(\sigma=5\) cm).
  2. Ein Handballtrainer untersucht eine neue Trainingsmethode, welche die Ausdauerleistung in besonderem Maße fördern soll. Hierzu führt er einen Ausdauertest mit 23 Handballspielern durch, welche nach dieser Methode trainiert wurden, und vergleicht deren Werte mit der Gesamtpopulation. Es sei bekannt, dass die Ergebnisse des Ausdauertests in der Gesamtpopulation normalverteilt sind mit einem Populationsdurchschnitt von \(\mu=80\) Punkten.

Lösung
  1. Verwendung des z-Tests:
    \(\rightarrow\) Es handelt sich mit \(n=10\) zwar um eine kleine Stichprobe, jedoch ist die Streuung in der Population \(\sigma\) bekannt. Wir wenden somit einen z-Test an.
  2. Verwendung des t-Tests:
    \(\rightarrow\) Die Streuung in der Population \(\sigma\) ist unbekannt, jedoch können wir von einer Normalverteilung in der Population ausgehen. Deshalb wenden wir einen t-Test an.



(2) Bei welcher der folgenden Untersuchungen muss ein t-Test für abhängige Stichproben und bei welcher ein t-Test für unabhängige Stichproben zur Auswertung verwendet werden?

  1. Es soll überprüft werden, ob das Hören von klassischer Musik während des Lernens die Konzentrationsleistung steigert. Hierzu wird die Leistung einer Stichprobe von \(n=30\) Personen in einem Konzentrationstest einmal beim Hören von klassischer Musik und einmal in stiller Umgebung erhoben.
  2. Ein Familientherapeut vermutet, dass in Familien mit zwei Kindern jüngere Geschwister ein stärkeres Selbstbewusstsein als ihre älteren Geschwister aufweisen. Zur Überprüfung dieser Hypothese werden 35 zufällig gewählte Geschwisterpaare untersucht.
  3. Ein Meinungsforschungsinstitut möchte herausfinden, ob Unterstützer der FDP den Austritt des Vereinigten Königreichs aus der europäischen Union anders bewerten als Unterstützer der SPD. Das Institut befragt sowohl Unterstützer der SPD als auch Unterstützer der FDP.

Lösung
  1. Verwendung des t-Tests für abhängige Stichproben
    \(\rightarrow\) Es handelt sich um eine wiederholte Messung der gleichen Personen zu zwei Messzeitpunkten. Die Messungen sind also nicht unabhängig.
  2. Verwendung des t-Tests für abhängige Stichproben
    \(\rightarrow\) Da in diesem Fall Geschwisterpaare untersucht werden, handelt es sich um Messpaare, also abhängige Messungen.
  3. Verwendung des t-Tests für unabhängige Stichproben
    \(\rightarrow\) Es handelt sich um eine Untersuchung zweier unabhängiger Gruppen (Unterstützer der FDP und der SPD).