Diskrete Zufallsvariablen

(1) Gesundheit am Arbeitsplatz

Es wird eine Intervention durchgeführt zur Förderung der subjektiven Gesundheit am Arbeitsplatz eines großen französischen Unternehmens.
Die Evaluation ergibt, dass sich nach der Intervention die Hälfte der Arbeitnehmer_innen gesünder fühlen und 1/6 der Arbeitnehmer_innen weniger gesund fühlen. Beim Rest der Arbeitnehmer_innen veränderte sich die subjektive Gesundheit nicht durch die Intervention.

(a) Bestimme eine Zufallsvariable, die die Veränderung der subjektiven Gesundheit auf geeignete Zahlen abbildet.


Lösung

  • Eine Zufallsvariable \(X\) ist eine Funktion, die den Ergebnissen (Elementarereignissen) eines Zufallsexperiments (zusammengefasst in der Menge \(\Omega\)), Zahlen zuordnet.

  • In unsrem Fall soll die Zufallsvariable die subjektive Gesundheit der Mitarbeiter_innen nach der Intervention in Zahlen abbilden.

  • Es gibt in dieser Hinsicht drei Gruppen der Arbeitnehmer_innen:

    • diejenigen, die sich nach der Intervention besser fühlen;
    • diejenigen, die sich schlechter fühlen;
    • diejenigen, die keine Veränderungen spüren.
  • Somit können wir die Zufallsvariable z.B. folgendermaßen definieren:

  • Man kann dafür auch ganz andere Zahlen nutzen, z.B. 1, 2, 3 oder -5, 0, 5. Das Entscheidende ist, dass die Zufallsvariable eindeutig den Ergebnissen des Zufallsexperiments “Ergebnis der Intervention” Zahlen zuordnet. Wir müssen klar unterscheiden können, welchem Ergebnis welche Zahl zugeordnet ist.


Weiterführendes

Wir sollten bei der Erstellung einer Zufallsvariable und Zuteilung von Zahlen zu den Ergebnissen eines Zufallsexperiments beachten, dass man immer das Skalenniveau beibehalten sollte, welches die Werte haben. In dem Fall von Martins Unternehmen haben wir es mindestens mit einer Ordinalskala zu tun und sollen deswegen die Rangfolge beibehalten. D.h. wir sollen größere Zahlen den “besseren” Ausprägungen der Zufallsvariable zuweisen.
Da wir später jedoch Differenzen berechnen wollen (Erwartungswert und Varianz), ist sogar Intervallskalenniveau notwendig. Auf diskrete Zufallsvariablen angewendet, müssten wir dafür bei der Erstellung einer Zufallsvariable die Abstände gleich groß wählen und die Annahme treffen, dass:

  1. die Arbeitnehmenden, deren subjektive Gesundheit sich verbessert, sich gleich viel besser durch die Intervention fühlen (genauso im Falle der Verschlechterung) und
  2. die Verbesserung und die Verschlechterung im gleichen Ausmaß ausfallen. Somit müsste der Abstand zur “bleibt gleich”-Realisierung von “besser” und “schlechter” gleich groß sein. Man könnte somit auch Varianten wie X = {6,0,-6} oder X = {-3,1,5} wählen.
Um Erwartungswert und Varianz einfacher zu interpretieren, können wir der “gleich”-Realisierung die 0 zuweisen.



(b) Handelt es sich um eine diskrete oder stetige Zufallsvariable?


Lösung

Es handelt sich um eine diskrete Zufallsvariable, da die Anzahl der Ergebnisse eine endliche Menge ist. D.h. wir können die Ergebnisse des Zufallsexperiments zählen: Es gibt nur drei mögliche Ausgänge.


(c) Wie wahrscheinlich ist es, dass sich Martin, der in dem Unternehmen arbeitet, besser fühlt?


Lösung

Hier schauen wir uns zuerst an, wie die Evaluation der Intervention ausgefallen ist:

  • die Hälfte der Mitarbeiter_innen fühlen sich gesünder,
  • 1/6 der Mitarbeiter_innen fühlen sich weniger gesund.

Die Wahrscheinlichkeit, dass Martin sich besser fühlt, ergibt sich aus dem Anteil der sich besser fühlenden Mitarbeiter an der Menge aller Mitarbeiter_innen. Jede_r zweite Mitarbeiter_in fühlt sich besser, also \[P(x_{Martin}=1)= \frac{1}{2}=0.5=50\%\] Die Wahrscheinlichkeit, dass sich Martin nach der Intervention besser fühlt, beträgt 50%.

Beachte: wir schreiben in diesem Fall \(x\) klein, weil wir damit eine bestimmte Realisierung der Zufallsvariable meinen und nicht die (theoretische) Zufallsvariable \(X\) selbst. Die Schreibweise \(P(x_{Martin}=1)\) drückt mathematisch die Wahrscheinlichkeit aus, dass Martin sich nach der Intervention besser fühlen wird (Realisierung 1 der Zufallsvariable).


(d) Wie wahrscheinlich ist es, dass sich Martin, der in dem Unternehmen arbeitet, zumindest nicht schlechter fühlt?


Lösung

Hier brauchen wir die Wahrscheinlichkeit dafür, dass Martin sich nach der Intervention entweder besser oder gleich fühlt. Das ist die Gegenwahrscheinlichkeit dazu, dass Martin sich schlechter fühlt.

\(\begin{aligned} P(x_{Martin} \geq0) &= P(x_{Martin}=0)+P(x_{Martin}=1)\\ &= 1-P(x_{Martin}=-1) \\ & = 1-\frac{1}{6}=\frac{5}{6} = .833 \end{aligned}\)

Die Wahrscheinlichkeit, dass sich Martin nach der Intervention zumindest nicht schlechter fühlt, beträgt 83.3%.
Beachte: Wir können beim Ausdrücken von Wahrscheinlichkeiten mehrere Realisierungen einer Zufallsvariable zusammenfassen: \(P(x_{Martin} \geq0)\) umfasst zwei Realisierungen unserer Zufallsvariable (1 und 0).
Alternativ zu der dargestellten Vorgehensweise können wir natürlich \(P(x_{Martin}=0)\) berechnen, diese Wahrscheinlichkeit zu \(P(x_{Martin}=1)\) addieren und auf diese Weise \(P(x_{Martin} \geq0)\) bestimmen.


(e) Welchen Veränderungswert in der subjektiven Gesundheit würde man bei einem_r beliebigen Arbeitnehmer_in erwarten?


Lösung

  • Hier wird danach gefragt, welche Veränderung im Mittel bei einem_r beliebigen Arbeitnehmer_in nach der Intervention erwartet wird. Das ist der Erwartungswert - ein Parameter der Wahrscheinlichkeitsverteilung.
  • Um dies zu erkennen, sollte man auf “Signalwörter” achten, wie “beliebig”, “erwarten”, die den Bezug auf eine theoretische Population oder Grundgesamtheit aller Arbeitnehmer_innen, die an der Intervention teilgenommen haben, (und nicht auf eine empirische, tatsächlich beobachtete Stichprobe, also die Mitarbeiter_innen des Unternehmens, in dem Martin arbeitet) deutlich machen.
  • Der Erwartungswert wird, wie folgt, berechnet:

\[E(X)=\mu= \sum_{i=1}^N x_i\cdot P(x_i)\]

  • D.h. wir sollen jede Ausprägung \(x_i\) der Zufallsvariable \(X\) mit der Wahrscheinlichkeit \(P(x_i)\) der jeweiligen Ausprägung multiplizieren und dann diese Produkte zusammenaddieren.

  • Dafür brauchen wir zuerst die Wahrscheinlichkeiten der drei möglichen Ausprägungen der Zufallsvariable:

    • Die Wahrscheinlichkeit, dass ein_e Mitarbeiter_in sich nach der Intervention besser fühlt, kennen wir bereits: \(P(x=1)= \frac{1}{2}\);
    • Die Wahrscheinlichkeit, dass ein_e Mitarbeiter_in sich nach der Intervention schlechter fühlt, kennen wir auch: \(P(x=-1)= \frac{1}{6}\);
    • Die Wahrscheinlichkeit, dass ein_e Mitarbeiter_in sich nach der Intervention gleich fühlt, können wir jetzt berechnen: \(P(x=0)= 1- (P(x=1)+P(x=-1)=1-(\frac{1}{2}+\frac{1}{6})= \frac{1}{3}\).
  • Jetzt berechnen wir den Erwartungswert:

\(\begin{aligned} E(X)=\mu &= \sum_{i=1}^3 x_i\cdot P(x_i)= x_1\cdot P(x_1)+x_2\cdot P(x_2)+x_3\cdot P(x_3)\\ & = 1 \cdot \frac{1}{2}+0\cdot \frac{1}{3}+ (-1)\cdot \frac{1}{6}=\frac{1}{3} \end{aligned}\)

  • Der Erwartungswert beträgt \(\frac{1}{3}\).


(f) Wie sehr streut die Veränderung im Unternehmen?


Lösung

  • Hier wird nach einem anderen Parameter gefragt, nämlich nach der (Populations-)Varianz.
  • Diese berechnen wird wie folgt:

\(\begin{aligned} Var(X)=\sigma^2 &= \sum_{i=1}^N (x_i-\mu)^2\cdot P(x_i)\\ &= (1-\frac{1}{3})^2\cdot \frac{1}{2} + (0-\frac{1}{3})^2\cdot \frac{1}{3}+(-1-\frac{1}{3})^2\cdot \frac{1}{6}\\ &= (\frac{2}{3})^2\cdot \frac{1}{2}+(-\frac{1}{3})^2\cdot \frac{1}{3}+ (-\frac{4}{3})^2\cdot \frac{1}{6}\\ &= \frac{4}{9} \cdot \frac{1}{2}+\frac{1}{9} \cdot \frac{1}{3}+\frac{16}{9} \cdot \frac{1}{6}\\ &= \frac{4}{18}+\frac{1}{27}+\frac{16}{54}=\frac{30}{54}=\frac{5}{9} \approx 0.556 \end{aligned}\)

  • Die (Populations-)Varianz beträgt \(\frac{5}{9}\).


(g) Ist die Intervention empfehlenswert?


Lösung

Auf diese Frage gibt es keine eindeutige richtige Antwort. Es ist viel wichtiger, dass man eigene Entscheidung gut begründen kann (d.h. dass sie wohl durchdacht ist). Man sollte immer darauf achten, welche Veränderungen erzielt werden sollen, aber auch können. Es ist auch nicht nur wichtig festzustellen, ob eine Intervention überhaupt Veränderungen verursacht, sondern auch, ob sie effizient ist (z.B. ob die Wirkung stark genug ist oder den Aufwand wert ist). Die Wirksamkeit der Intervention können wir deskriptiv daran erkennen, wie die Parameter der Wahrscheinlichkeitsverteilung sind.

  • Der Erwartungswert beträgt \(\frac{1}{3}\). D.h. es wird im Durchschnitt eine positive Veränderung der subjektiven Gesundheit erzielt. Jedoch ist diese Veränderung näher an 0 (also, kein Effekt der Intervention) als an 1 (also, positive Veränderung).
  • Die (Populations-)Varianz beträgt \(\frac{5}{9}\). D.h. die Standardabweichung beträgt \(\sigma=\sqrt{\frac{5}{9}} \approx 0.745\). Diese Streuung ist ziemlich groß, v.a. dafür, dass die durchschnittliche Veränderung nicht besonders groß ist.

Also, man kann daraus schlussfolgern, dass die Intervention nicht besonders empfehlenswert ist, obwohl sie tatsächlich Veränderungen in die erwünschte Richtung erzielt. Sollte die Intervention jedoch sehr preiswert und einfach umsetzbar sein, könnte es sich trotzdem lohnen, sie anzuwenden. So hängt die Beantwortung der Fragestellung vom Kontext ab. Ein wichtiger Punkt ist auch, dass es einigen Mitarbeiter_innen durch die Intervention schlechter geht: man muss sich also überlegen, ob eine Intervention mit Verschlechterungsrisiko gerechtfertigt und ethisch vertretbar ist.



(2) Würfeln

Es werden zwei Würfel gleichzeitig geworfen.

(a) Bestimme die Wahrscheinlichkeit der Ereignisse A und B.
A: Die Augensumme ist mindestens 10.
B: Die Augensumme ist größer als 4 und höchstens 7.


Lösung

A: Die Augensumme ist mindestens 10.

  • Zuerst bestimmen wir die Anzahl möglicher Ereignisse. Der Würfel hat 6 Seiten und wird zweimal geworfen, also \(6^2=36\) Ereignisse sind möglich.

  • Jetzt definieren wir das Ereignis \(A\). Darin enthalten sind alle Würfelwürfe, deren Augensumme mindestens 10 ist. D.h. damit sind alle Ausgänge des Zufallsexperiments gemeint, bei denen die Augensumme 10 (die Kombinationen (4,6), (6,4), (5,5)), 11 (die Kombinationen (5,6), (6,5)) und 12 (die Kombination (6,6)) ist.
    \(A=\{(4,6), (6,4), (5,5), (5,6), (6,5), (6,6)\}\)

  • Jetzt können wir die Wahrscheinlichkeit des Ereignisses \(A\) berechnen:

\[P(A)=P(10)+P(11)+P(12)=\frac{3}{36}+\frac{2}{36}+\frac{1}{36}=\frac{6}{36}=\frac{1}{6} \approx .167\]

  • Dabei ergeben sich die Wahrscheinlichkeiten für die einzelnen Augensummen aus der Anzahl der passenden Ereignisse geteilt durch die Gesamtanzahl der Ereignisse. Die allgemeine Formel lautet \(P(A)=\frac{|A|}{|\Omega|}\).Z.B. ist die Wahrscheinlichkeit für die Augensumme 10 gleich \(\frac{3}{36}\), da es 3 Möglichkeiten gibt, diese Augensumme zu werfen und insgesamt gibt es 36 mögliche Ausgänge des zweimaligen Würfelwurfs.
  • Die Wahrscheinlichkeit dafür, dass die Augensumme beim zweimaligen Würfelwurf mindestens 10 ist, beträgt ca. 16.7%.

B: Die Augensumme ist größer als 4 und höchstens 7.

  • Die Anzahl der möglichen Ereignisse bleibt unverändert und beträgt 36.

  • Wir sollen das Ereignis \(B\) definieren. Darin enthalten sind alle Ergebnisse des zweimaligen Würfelwurfs, die eine Augensumme von 5 (die Kombinationen (1,4), (2,3), (3,2), (4,1)), 6 (die Kombinationen (1,5), (2,4), (3,3), (4,2), (5,1)) und 7 (die Kombinationen (1,6), (2,5), (3,4), (4,3), (5,2), (6,1)) ergeben. Die 4 ist nicht enthalten, da die Augensumme größer als 4 sein muss. Die 7 ist enthalten, da die Augensumme höchstens 7 sein soll, d.h. die 7 ist die letzte inkludierte Zahl.
    \(\begin{aligned} B= & \{(1,4), (1,5), (1,6), (2,3), (2,4), (2,5), (3,2), (3,3), (3,4), (4,1), (4,2), \\ & (4,3), (5,1), (5,2), (6,1)\} \end{aligned}\)

  • Jetzt können wir die Wahrscheinlichkeit des Ereignisses \(B\) berechnen: \[P(B)= P(5)+P(6)+P(7)= \frac{4}{36}+\frac{5}{36}+\frac{6}{36}=\frac{15}{36}=\frac{5}{12}\approx .417 \]

  • Die Wahrscheinlichkeit dafür, dass die Augensumme beim zweimaligen Würfelwurf größer als 4 und höchstens 7 ist, beträgt ca. 41.7%.


(b) Es werden 4 Würfel gleichzeitig geworfen. Bestimme die Wahrscheinlichkeit des Ereignisses C.
C: Es wird 4-mal die gleiche Zahl geworfen.


Lösung

  • Jetzt müssen wir die Anzahl der möglichen Ereignisse neu bestimmen, da jetzt 4 Würfel gleichzeitig geworfen werden. Jeder Würfel hat 6 Seiten. Daraus ergeben sich \(6^4=1296\) mögliche Ereignisse (d.h. Würfelwurfkombinationen).

  • als Nächstes definieren wir das Ereignis \(C\). Wir müssen dazu alle Ergebnisse des viermaligen Würfelwurfs auflisten, bei denen viermal die gleiche Zahl geworfen wird.
    \(C= \{(1,1,1,1), (2,2,2,2), (3,3,3,3), (4,4,4,4), (5,5,5,5), (6,6,6,6)\}\)

  • Die Wahrscheinlichkeit für jedes einzelne Ergebnis, das darin enthalten ist, beträgt \(\frac{1}{6^4}\). Dann beträgt die Wahrscheinlichkeit des Ereignisses \(C\): \[P(C)=\frac{1}{6^4}+\frac{1}{6^4}+\frac{1}{6^4}+\frac{1}{6^4}+\frac{1}{6^4}+\frac{1}{6^4}=\frac{6}{6^4}=\frac{1}{1296}\approx .005\]

    • Die Wahrscheinlichkeit dafür, dass beim viermaligen Würfelwurf viermal die gleiche Zahl geworfen wird, beträgt ca. 0.5%.



(3) Urne

In einer Urne sind fünf Kugeln, welche mit den Zahlen 1, 2, 3, 4, 5 beschriftet sind.

Welche der folgenden Aussagen sind wahr?

  1. Für das einmalige Ziehen einer Kugel aus der Urne gilt: Der Erwartungswert der Zufallsvariable beträgt 3.

  2. Für das einmalige Ziehen einer Kugel aus der Urne gilt: Die Standardabweichung der Zufallsvariable beträgt 2.

  3. Für das zweimalige Ziehen einer Kugel aus der Urne mit Zurücklegen gilt: Der Ergebnisraum enthält genau 10 Zahlenpaare.

  4. Für das zweimalige Ziehen einer Kugel aus der Urne mit Zurücklegen gilt: Berechnet man jeweils die Summe der Zahlen auf den zwei gezogenen Kugeln, so beträgt der Erwartungswert dieser Summe genau 6.


Lösung

  1. Für das einmalige Ziehen einer Kugel aus der Urne gilt: Der Erwartungswert der Zufallsvariable beträgt 3.
    RICHTIG.
    Die Wahrscheinlichkeit für jede von den fünf Kugeln gezogen zu werden beträgt \(P(\{1\})= P(\{2\})=P(\{3\})=P(\{4\})=P(\{5\})=\frac{1}{5}=.2\).
    Jetzt setzen wir diese Wahrscheinlichkeit in die Formel für den Erwartungswert ein und berechnen diesen: \(\begin{aligned} E(X)=\mu &= \sum_{i=1}^5 x_i\cdot P(x_i)\\ &= x_1\cdot P(x_1)+x_2\cdot P(x_2)+x_3\cdot P(x_3)+x_4\cdot P(x_4)+x_5\cdot P(x_5)\\ & = 1 \cdot .2 +2\cdot .2+ 3\cdot .2 + 4\cdot .2 + 5\cdot .2=3 \end{aligned}\)

  2. Für das einmalige Ziehen einer Kugel aus der Urne gilt: Die Standardabweichung der Zufallsvariable beträgt 2.
    FALSCH.
    Zuerst berechnen wir die Varianz der Zufallsvariable: \(\begin{aligned} \sigma^2 &= \sum_{i=1}^N (x_i-\mu)^2\cdot P(x_i)\\ &= (1-3)^2\cdot .2 + (2-3)^2\cdot .2+(3-3)^2\cdot .2 + (4-3)^2\cdot .2 + (5-3)^2\cdot .2\\ &= 4\cdot .2 + 1\cdot.2 + 0 +1\cdot.2+4\cdot.2\\ &=2 \end{aligned}\)
    Für die Standardabweichung müsste noch die Wurzel aus \(2\) gezogen werden: \(\sigma = \sqrt{\sigma^2}=\sqrt{2} \approx 1.414\)

  1. Für das zweimalige Ziehen einer Kugel aus der Urne mit Zurücklegen gilt: Der Ergebnisraum enthält genau 10 Zahlenpaare.
    FALSCH, es sind \(5^2 = 25\) Zahlenpaare.
    \(\begin{aligned} \Omega = &\{(1,1), (1,2), (1,3), (1,4), (1,5),\\ &(2,1), (2,2), (2,3), (2,4), (2,5),\\ &(3,1), (3,2), (3,3), (3,4), (3,5),\\ &(4,1), (4,2), (4,3), (4,4), (4,5),\\ &(5,1), (5,2), (5,3), (5,4), (5,5)\} \end{aligned}\)

  1. Für das zweimalige Ziehen einer Kugel aus der Urne mit Zurücklegen gilt: Berechnet man jeweils die Summe der Zahlen auf den zwei gezogenen Kugeln, so beträgt der Erwartungswert dieser Summe genau 6.
    RICHTIG.
    Zuerst berechnen wir die Summen der Zahlen auf den zwei gezogenen Kugeln. Dazu können wir die Werte aus dem Ergebnisraum \(\Omega\) nehmen, den wir in der Aufgabe (c) definiert haben.
    \(\begin{aligned} Summen_{\Omega} = &\{( 2 ), ( 3 ), ( 4 ), ( 5 ), ( 6 ),\\ &( 3 ), ( 4 ), ( 5 ), ( 6 ), ( 7 ),\\ &( 4 ), ( 5 ), ( 6 ), ( 7 ), ( 8 ),\\ &( 5 ), ( 6 ), ( 7 ), ( 8 ), ( 9 ),\\ &( 6 ), ( 7 ), ( 8 ), ( 9 ), (10)\} \end{aligned}\)
    Jetzt bestimmen wir die Häufigkeit der einzelnen Summenwerte und bestimmen damit deren Wahrscheinlichkeiten. Im Zähler steht immer die Häufigkeit des jeweiligen Summenwerts und im Nenner die Gesamtanzahl der Ergebnisse.
    \(P(\{2\})=\frac{1}{25}\)
    \(P(\{3\})=\frac{2}{25}\)
    \(P(\{4\})=\frac{3}{25}\)
    \(P(\{5\})=\frac{4}{25}\)
    \(P(\{6\})=\frac{5}{25}\)
    \(P(\{7\})=\frac{4}{25}\)
    \(P(\{8\})=\frac{3}{25}\)
    \(P(\{9\})=\frac{2}{25}\)
    \(P(\{10\})=\frac{1}{25}\)
    Wir berechnen den Erwartungswert der Summe der Zahlen auf den zwei gezogenen Kugeln:
    \(\begin{aligned} E(X)=\mu_{Summe} &= \sum_{i=1}^N x_i\cdot P(x_i)\\ & = 2 \cdot \frac{1}{25} +3\cdot \frac{2}{25} + 4\cdot \frac{3}{25} + ...+ 8\cdot \frac{3}{25} + 9\cdot \frac{2}{25} + 10\cdot \frac{1}{25} \\ &=6 \end{aligned}\)


Nun wird je eine Kugel mit der Aufschrift “2” und “5” zusätzlich in die Urne gelegt.
Wie verändern sich Erwartungswert und Standardabweichung für einmaliges Ziehen?


Lösung

Jetzt haben wir 7 Kugeln in der Urne. Das Ziehen einer Kugel mit einer bestimmten Zahl ist nicht mehr gleich wahrscheinlich:
\(P(\{2\})=P(\{5\})=\frac{2}{7}\)
\(P(\{1\})=P(\{3\})=P(\{4\})=\frac{1}{7}\)
Der Erwartungswert lässt sich, wie folgt, berechnen:
\(\begin{aligned} E(X)=\mu &= \sum_{i=1}^N x_i\cdot P(x_i)\\ & = 1 \cdot \frac{1}{7}+2\cdot \frac{2}{7}+3\cdot \frac{1}{7}+4\cdot \frac{1}{7}+5\cdot \frac{2}{7} \\ &= \frac{22}{7} \approx 3,143 \end{aligned}\)
Der Erwartungswert wird größer im Vergleich zu dem Fall mit fünf gleich wahrscheinlichen Zahlen: \(3,143>3\).
Jetzt berechnen wir die Varianz: 

\(\begin{aligned} \sigma^2 &= \sum_{i=1}^N (x_i-\mu)^2\cdot P(x_i)\\ &= (1-\frac{22}{7})^2 \cdot \frac{1}{7} + (2-\frac{22}{7})^2 \cdot \frac{2}{7} + (3-\frac{22}{7})^2 \cdot \frac{1}{7} + (4-\frac{22}{7})^2 \cdot \frac{1}{7} \\ & + (5-\frac{22}{7})^2 \cdot \frac{2}{7} \\ &= \frac{104}{49} \approx 2,122 \end{aligned}\)

Zum Schluss berechnen wir die Standardabweichung:
\(\sigma=\sqrt{2.122}=1.457\)
Die Standardabweichung wird größer im Vergleich zu dem Fall mit fünf gleich wahrscheinlichen Zahlen: \(1.457>1.414\).


Zeichne die zugehörige Verteilungsfunktion!


Lösung

Jetzt scheiben wir nochmal die Wahrscheinlichkeiten für die einzelnen Ergebnisse auf:
\(P(\{2\})=P(\{5\})=\frac{2}{7}\)
\(P(\{1\})=P(\{3\})=P(\{4\})=\frac{1}{7}\)
Für die Verteilungsfunktion brauchen wir die kumulierten Wahrscheinlichkeiten. Das sind die Wahrscheinlichkeiten, höchstens die jeweilige Zahl zu ziehen. Man berechnet die kumulierte Wahrscheinlichkeit eines Ergebnisses, indem man die Wahrscheinlichkeiten für alle Ergebnisse bis einschließlich dieses Ergebnis addiert:
\(P(\{1\})=\frac{1}{7}\)
\(P(\{2\})=\frac{3}{7}\)
\(P(\{3\})=\frac{4}{7}\)
\(P(\{4\})=\frac{5}{7}\)
\(P(\{5\})=\frac{7}{7}=1\)
Diese Zahlen tragen wir auf der \(y\)-Achse unserer Grafik ab. Auf der \(x\)-Achse sind die Zahlen auf den Kugeln abgetragen.


Binomialverteilung

(4) Binomialverteilte Zufallsvariable

Die Zufallsvariable \(X\) ist binomialverteilt mit den Parametern \(n\) und \(\pi\).
Berechne die folgenden Wahrscheinlichkeiten (wenn möglich) mit Hilfe der Tabelle der Binomialverteilung!

(a) 7 Erfolge bei \(n\) = 10 Versuchen mit \(\pi\) = .3.


Lösung

Wir schauen in der Tabelle der Binomialverteilung nach:

  • in der ersten Spalte ist die Anzahl an Versuchen angegeben: wir finden \(n=10\)
  • in der zweiten Spalte ist die Anzahl an Erfolgen angegeben: wir brauchen die Zeile für \(k=7\).
  • in den restlichen Spalten sind die Erfolgswahrscheinlichkeiten \(\pi\) angegeben: wir suchen die Spalte mit \(\pi=.3\) heraus.
  • Jetzt schauen wir, wo die ausgewählten Zeile und Spalte sich kreuzen: da steht die gesuchte Wahrscheinlichkeit: \(P(x=7)=.0090\)


(b) Mindestens 2 Erfolge bei \(n\) = 20 Versuchen mit \(\pi\) = .1.


Lösung

Hier betrachten wir alle Ausprägungen der binomialverteilten Zufallsvariable, bei denen mindestens 2 Erfolge bei 20 Versuchen eingetreten sind. Wir müssen also die Wahrscheinlichkeiten für jedes passende Ergebnis mit Hilfe der Tabelle bestimmen und aufsummieren. So kommen wir auf die gesuchte Wahrscheinlichkeit.
Jedoch sind das ziemlich viele Ergebnisse, da wir die Fälle mit 2 bis 20 Erfolgen betrachten sollen. Die einzigen Ergebnisse, die nicht darunter fallen, sind die Fälle, bei denen 0 oder 1 Erfolg bei 20 Versuchen erzielt wurden. Also, können wir auch die gesuchte Wahrscheinlichkeit über die Gegenwahrscheinlichkeit bestimmen. Das erfordert viel weniger Aufwand.
\(\begin{aligned} P(x\geq 2)&=P(x=2)+P(x=3)+P(x=4)+...+P(x=19)+P(x=20)\\ &=1 -P(x=0)-P(x=1) \end{aligned}\)
Jetzt können wir die erforderlichen Wahrscheinlichkeiten berechnen. Wir können sie nicht in der Tabelle der Binomialverteilung nachschauen, da unsere Tabelle nur bis \(n=10\) geht. Wir erinnern uns an die folgende Formel:

\[P(x)=\binom{n}{x}\cdot \pi^x \cdot (1-\pi)^{n-x}\]

Anmerkung: \(x\) bezeichnet die Anzahl der Erfolge und entspricht \(k\) in der Tabelle der Binomialverteilung.

Für \(P(x=0)\): Wir setzen die Werte \(n=20\), \(x=0\) und \(\pi=.1\) in die Formel ein:
\(P(x=0)=\binom{20}{0}\cdot.1^0\cdot.9^{20} = 1\cdot 1\cdot .1216= .1216\)

Für \(P(x=1)\): Wir setzen die Werte \(n=20\), \(x=1\) und \(\pi=.1\) in die Formel ein:
\(P(x=1)=\binom{20}{1}\cdot.1^1\cdot.9^{19} = 20\cdot .1\cdot .1351= .2702\)

Jetzt können wir die gesuchte Wahrscheinlichkeit für mindestens 2 Erfolge bei 20 Versuchen bestimmen:
\(P(x\geq 2)= 1- .1216 – .2702 = .6082\)
Diese Wahrscheinlichkeit beträgt ca. 60.8%.


(c) Weniger als 5 Erfolge bei \(n\) = 5 Versuchen mit \(\pi\) = .4.


Lösung

Hier ist die Wahrscheinlichkeit für 0, 1, 2, 3 oder 4 Erfolge in 5 Versuchen gesucht. Alternativ können wir diese Wahrscheinlichkeit über die Gegenwahrscheinlichkeit ausdrücken:
\(\begin{aligned} P(x\leq 4) = P(x<5) &= P(x=0)+P(x=1)+P(x=2)+P(x=3)+P(x=4)\\ &= 1- P(x=5) \end{aligned}\)
Wir schauen jetzt die Wahrscheinlichkeit für \(P(x=5)\) in der Tabelle der Binomialverteilung nach:

  • wir suchen die Zeile heraus für \(n=5\) und \(k=5\)
  • und die Spalte für \(\pi=.4\)
  • die Wahrscheinlichkeit beträgt \(P(x=5)=.0102\)
Jetzt berechnen wir die gesuchte Wahrscheinlichkeit:
\(P(x\leq 4)= 1-P(x=5) = 1 – .0102 = .9898\)
Die Wahrscheinlichkeit Weniger als 5 Erfolge bei \(n\) = 5 Versuchen mit \(\pi\) = .4 zu haben beträgt ca. 99%.



(5) Klavierstunde

Der Psychologiestudent Alexander hat bald seine erste Klavierstunde und hat sich dafür ein Klavier gekauft.
Dieses hat 88 Tasten, davon 52 weiße und 36 schwarze. Gerade drückt er zur Freude seiner Familie mit geschlossenen Augen wahllos darauf herum.

(a) Wie groß ist die Wahrscheinlichkeit, dass Alexander beim Drücken von einer Taste eine schwarze trifft?


Lösung

Die Wahrscheinlichkeit beim Drücken von einer Taste eine schwarze zu treffen entspricht der Wahrscheinlichkeit eine schwarze Taste zu drücken und beträgt \(P(schwarz)=\frac{36}{88}\).
Alternativ:
Wir können die Zufallsvariable “gedrückte Taste” als binomialverteilt ansehen. Dabei würden wir als Erfolg das Drücken einer schwarzen Taste festlegen und als Misserfolg - das Drücken einer weißen Taste. Damit können wir die Erfolgswahrscheinlichkeit \(\pi\) bestimmen:
\(\pi = P(schwarz)= \frac{36}{88}\)
Also:\(1-\pi=P(weiß)=\frac{52}{88}\)
Wir können also die Fragestellung folgendermaßen umformulieren: Wie wahrscheinlich ist es, 1 Erfolg bei 1 Versuch zu haben, wenn \(\pi=\frac{36}{88}\) ist?
Diese Wahrscheinlichkeit können wir, wie folgt, berechnen:

\(\begin{aligned} P(x)&=\binom{n}{x}\cdot \pi^x \cdot (1-\pi)^{n-x}\\ &=\binom{1}{1}\cdot \frac{36}{88}^1\cdot \frac{52}{88}^0\\ &= 1\cdot \frac{36}{88}\cdot 1 = \frac{36}{88} \approx .4091 \end{aligned}\)

Wir sehen, dass beide Lösungswege zu demselben Ergebnis führen.


(b) Wie groß ist die Wahrscheinlichkeit, dass Alexander beim Drücken von 10 Tasten genau 5 weiße und 5 schwarze trifft?


Lösung

Hier können wir entscheiden, was wir als Erfolg und was als Misserfolg sehen. Wir können z.B. als Erfolg das Drücken einer schwarzen Taste festlegen und als Misserfolg das Drücken einer weißen Taste. Damit bestimmen wir die Erfolgswahrscheinlichkeit \(\pi\), wie in der Aufgabe zuvor:
\(\pi = P(schwarz)= \frac{36}{88}\)
Also:\(1-\pi=P(weiß)=\frac{52}{88}\)
Wir können also die Fragestellung folgendermaßen umformulieren: Wie wahrscheinlich ist es, 5 Erfolge bei 10 Versuchen zu haben, wenn \(\pi=\frac{36}{88}\) ist?
Diese Wahrscheinlichkeit können wir so berechnen:
\(\begin{aligned} P(x)&=\binom{n}{x}\cdot \pi^x \cdot (1-\pi)^{n-x}\\ &=\binom{10}{5}\cdot \frac{36}{88}^5\cdot \frac{52}{88}^5\\ &= \approx .2080 \end{aligned}\)
Wir erhalten dasselbe Ereignis, wenn wir eine weiße Taste als Erfolg festlegen und von \(\pi = \frac{52}{88}\) ausgehen.



(6) Beruhigungsmittel

Eine Forscherin möchte die Wirksamkeit eines neuen Beruhigungsmittels in einer placebo-kontrollierten Studie testen. Dabei wird durch Zufall entschieden, wer das Placebo und wer das richtige Medikament bekommt. Aus logistischen Gründen werden die Versuchspersonen zufällig in zwei gleich lange Schlangen aufgeteilt, um sich aus einer am Ende der jeweiligen Schlange befindlichen Kiste ein Fläschchen ohne Label zu nehmen. Eigentlich sollten in den zwei Kisten gleich viele Medikamente und Placebos sein, damit jede Person die gleiche Chance hat, in eine der Bedingungen zu kommen. In der rechten Schlange hat sich die Studentische Hilfskraft der Forscherin jedoch verzählt, sodass nur 40% der Fläschchen in der Kiste mit Medikament befüllt sind.
(a) Wie wahrscheinlich ist es, dass die erste Person, die einer der Schlangen zugeordnet wird, in die Medikamentenbedingung gelangt?
Tipp: Visualisiert euch das Experiment anhand eines Baumdiagramms!


Lösung

Uns liegen Informationen über die Aufteilung in die Schlangen und die jeweilige Wahrscheinlichkeit innerhalb der einzelnen Schlangen in die Medikamentenbedingung zu gelangen vor. Bei zweiterem handelt es sich also um bedingte Wahrscheinlichkeiten. Mit diesem Wissen können wir ein Baumdiagramm zeichnen. Mithilfe der Pfadregeln können wir schließlich die Wahrscheinlichkeit der Pfade mit Endzustand in der Medikamentenbedingung berechnen. Dabei handelt es sich um den Satz der totalen Wahrscheinlichkeit.

\(P(Medikament)= .5 \cdot .5+ .5 \cdot .4 = .45\)

Damit beträgt die Wahrscheinlichkeit, dass eine beliebige Versuchsperson in die Medikament-Bedingung gelangt, 45%.


(b) Handelt es sich hierbei um einen Bernoulli-Prozess? Warum (nicht)?


Lösung

Nein, es handelt sich hierbei nicht um einen Bernoulli-Prozess. Verschiedene Annahmen werden verletzt:

  • Kriterium der konstanten Erfolgswahrscheinlichkeit verletzt:
    • Je nach Schlange handelt es sich um anderes \(p\) / \(\pi\) bzw. dieses bleibt nicht konstant.
  • Kriterium der dichotomen Variablen verletzt:
    • Es gibt nicht mehr 2 Outcomes (Gewinn oder Verlust bzw. Medikament oder Placebo), sondern in dem Sinne 4 (links & Medikament, rechts & Medikament, links & Placebo, rechts & Placebo)
  • Kriterium der unabhängigen Versuche verletzt:
    • Die Schritte (siehe Baumdiagramm) sind nicht unabhängig voneinander. Das heißt, dass die Erfolgswahrscheinlichkeit von der Schlange abhängt.


(c) Was könnte man tun, damit wir es wirklich mit einem Bernoulli-Versuch zu tun haben?


Lösung

  • System der Reihen wird aufgegeben
  • Für jede VP ein Medikament und ein Placebo beschaffen. Die SHK lässt dann jede Person zwischen zwei Fläschchen entscheiden (ein Placebo, ein Medikament) und stellt dann der nächsten Versuchsperson wieder zwei Fläschchen zur Auswahl hin. So besteht wirklich für alle eine 50% Chance auf das Medikament.


Eure Ideen wurden umgesetzt, sodass wir es jetzt mit einem Bernoulli-Versuch zu tun haben. Die Wahrscheinlichkeit, ein Medikament zu bekommen, beträgt also für jede Person 50%. Eine Gruppe von 10 Freund_innen nimmt an dem Experiment teil.

(d) Wie wahrscheinlich ist es, dass genau drei von ihnen in die Medikamentenbedingung kommen?


Lösung

Hier sollen wir die Wahrscheinlichkeit bestimmen, genau 3 Erfolge (Einteilung in die Medikament-Bedingung) in 10 Versuchen zu erzielen.
Die Erfolgswahrscheinlichkeit beträgt: \(P(Medikament) = .5\)
Wir setzen diese Zahlen in die Formel der Wahrscheinlichkeitsfunktion der Binomialverteilung ein und bestimmen die gesuchte Wahrscheinlichkeit:
\(\begin{aligned} P(x=3)&=\binom{n}{x}\cdot \pi^x \cdot (1-\pi)^{n-x}\\ P(x=3) = \binom{10}{3}\cdot .5^3\cdot .5^7 = 120 \cdot .0078125 \cdot .125 = .117 \end{aligned}\)

Die Wahrscheinlichkeit, dass von den 10 Freund_innen genau 3 in die Medikamentenbedingung kommen, beträgt ca. 12%.


(e) Wie wahrscheinlich ist es, dass mindestens 4 von ihnen in die Medikamentenbedingung kommen?


Lösung

Hier sollen wir die Wahrscheinlichkeit in 10 Versuchen mindestens 4 Erfolge (Einteilung in die Medikamentenbedingung) zu erzielen.
Die gesuchte Wahrscheinlichkeit setzt sich zusammen aus den Wahrscheinlichkeiten 4, 5, 6, 7, 8, 9 oder 10 Erfolge in 10 Versuchen zu haben. Um Zeit und Aufwand zu sparen, können wir mit der Gegenwahrscheinlichkeit arbeiten:

\(\begin{aligned} P(x \geq 4) &= P(x=4)+P(x=5)+(Px=6)+P(x=7)+P(x=8)+P(x=9)+P(x=10)\\ &=1 – P(x < 4) = 1-(P(x=0)+P(x=1)+P(x=2)+P(x=3))\\ &= 1- (\binom{10}{0}\cdot .5^0\cdot .5^{10}+ \binom{10}{1}\cdot .5^1\cdot .5^9 + \binom{10}{2}\cdot .5^2\cdot .5^8 + \\ &+ \binom{10}{3}\cdot .5^3\cdot .5^7)\\ &= 1-(.00098 + .0098 + .044 + .117) = 1- .1713 = .828 \end{aligned}\)

Die Wahrscheinlichkeit, dass von den 10 FreundInnen mindestens 4 in die Medikamentenbedingung kommen, beträgt ca. 83%.