(1) Busfahrt
Martin fühlt sich nicht mehr wohl an seinem Arbeitsplatz. Er möchte sich auf eine vakant gewordene Stelle an einem kleineren französischen Unternehmen bewerben, das ebenfalls sehr renommiert ist.
Zu dem morgigen Bewerbungsgespräch fährt er mit einem Bus, der regelmäßig alle 20 Minuten kommt.
(a) Bestimme eine Zufallsvariable, die die Wartezeit ohne Informationsverlust auf geeignete Zahlen abbildet.
Die Wartezeit kann zwischen 0 (der Bus kommt sofort) und 20 Minuten (der Bus ist gerade abgefahren und Martin muss 20 min warten) liegen. Dabei kann der Bus jeden Moment kommen, sodass die möglichen Ergebnisse der Zufallsvariable nicht nur jede von den 20 Minuten sind, sondern auch alle Zeitausprägungen dazwischen. Wir können also theoretisch beliebig genau den Zeitpunkt herausfinden, zu dem der Bus kommen wird. Damit können wir die Zufallsvariable folgendermaßen bestimmen:
\[X = [0 , 20) ; x \in R\]
(b) Handelt es sich um eine diskrete oder stetige Zufallsvariable?
Diese Zufallsvariable ist stetig, da die Anzahl an möglichen Ausgängen des Zufallsexperiments (alle möglichen Wartezeiten) überabzählbar ist. Wir können die Wartezeiten beliebig genau bestimmen.
(c) Wie wahrscheinlich ist es, dass Martin nur maximal 5 Minuten warten muss?
Die Zufallsvariable “Wartezeit” ist gleichverteilt. Da bedeutet z.B., dass die Wahrscheinlichkeit dafür, dass Martin von 0 bis 5 Minuten wartet, gleich der Wahrscheinlichkeit ist, dass er zwischen 15 und 20 Minuten warten muss.
Die Wartezeit von maximal 5 Minuten beträgt \(\frac{5}{20}=\frac{1}{4}\) der möglichen Länge der Wartezeit (maximal kann man 20 Minuten warten). Anders gesagt ist die Wartezeit von 5 Minuten das 25%-Perzentil, unter dem 25% der Wartezeiten liegen. Damit können wir die gesuchte Wahrscheinlichkeit bestimmen:
\[P(x_{Martin}\leq 5) = \frac{1}{4}= .25\] Die Wahrscheinlichkeit, dass Martin nur maximal 5 Minuten warten muss, beträgt 25%.
(d) Wie wahrscheinlich ist es, dass Martin überhaupt nicht warten muss?
Hier wird nach der Wahrscheinlichkeit für eine einzelne Ausprägung der Zufallsvariable gefragt. Da dies aber eine stetige Zufallsvariable ist, geht die Wahrscheinlichkeit für jede einzelne Ausprägung (dass der Bus exakt zu einem bestimmten Zeitpunkt kommt) gegen 0. Es ist unglaublich unwahrscheinlich, dass der Bus genau 0,000 Sekunden nach Martins Ankunft kommt und nicht beispielsweise 0,0001 Sekunden später.
(2) z-Werte
Sei \(Z\) ~ \(N\) (0,1) und \(z\) = 1.20
(a) Bestimme die Größe der schraffierten Flächen mit Hilfe der Tabelle der Standardnormalverteilung.
(b) Was bedeuten diese Werte?
Allgemein: Die schraffierten Flächen in der Wahrscheinlichkeitsdichtefunktion der Standardnormalverteilung sind die Wahrscheinlichkeiten, maximal bzw. mindestens den Wert \(z\) in dem schraffierten Bereich zu haben. Diese Wahrscheinlichkeiten bestimmen wir mit Hilfe der Verteilungsfunktion der Standardnormalverteilung, deren Tabelle uns zur Verfügung steht.
Wir suchen hier die Wahrscheinlichkeit, höchstens den Wert \(z\) aus der Verteilung zu ziehen. Diese Wahrscheinlichkeit \(P(z \leq 1.20)\) können wir, wie folgt, bestimmen:
Die Wahrscheinlichkeit, höchstens den Wert \(z=1.20\) aus der Verteilung zu ziehen, beträgt 88.5%.
Beachte: Wir können im Fall von stetigen Zufallsvariablen entweder \(P(z \leq 1.20)\) oder \(P(z < 1.20)\) schreiben, da die Wahrscheinlichkeit für jede einzelne Ausprägung gegen 0 geht.
Die hier dargestellte Fläche ist komplementär zu der Fläche 1 oben. Sie entspricht der Wahrscheinlichkeit, mindestens den Wert \(z=1.20\) aus der Verteilung zu ziehen.
Die Wahrscheinlichkeit, mindestens den Wert \(z=1.20\) aus der Verteilung zu ziehen, beträgt 11.5%.
Die Fläche entspricht der Wahrscheinlichkeit mindestens den Wert \(-z\) aus der Verteilung zu ziehen.
Die Wahrscheinlichkeit, mindestens den Wert \(z=-1.20\) aus der Verteilung zu ziehen, beträgt 88.5%.
Diese Fläche haben wir schon indirekt bestimmt. Sie entspricht der Wahrscheinlichkeit, höchstens den Wert \(-z\) aus der Verteilung zu ziehen.
Die Wahrscheinlichkeit, höchstens den Wert \(z=-1.20\) aus der Verteilung zu ziehen, beträgt 11.5%.
Diese zwei Flächen beschreiben die Wahrscheinlichkeit, dass man einen Wert an den Rändern der Verteilung zieht: entweder höchstens den Wert \(-z\) oder mindestens den Wert \(z\).
(3) IQ-Werte
Es sei bekannt, dass IQ-Werte in der Population normalverteilt ist mit x ~ N(100, 100).
(a) Welchen IQ-Wert müsste eine zufällig ausgewählte Person mindestens aufweisen, um zu den besten 2,5% zu gehören?
Als erstes veranschaulichen wir mit einer Skizze, um welche Wahrscheinlichkeiten und Flächen unter der Dichtefunktion der z-Verteilung es hier geht. Wir schauen uns die besten 2.5% der Verteilung (die blau gefärbte Fläche rechts) und suchen den IQ-Wert, der diese 2.5% der Verteilung eingrenzt.
Diesem gesuchten IQ-Wert entspricht in der dargestellten Standardnormalverteilung der \(z\)-Wert \(z_{97.5\%}\), der die oberen 2.5% nach oben abgrenzt.
Jetzt müssen wir den IQ-Wert bestimmen, der diesem \(z\)-Wert entspricht.
\[z_{97.5\%}=\frac{x_{97.5\%}-\mu}{\sigma}\]
Um den IQ-Wert zu bestimmen, müssen wir diese Formel nach \(x_{97.5\%}\) umstellen:
\(z_{97.5\%}=\frac{x_{97.5\%}-\mu}{\sigma}\)
\(z_{97.5\%}\cdot \sigma=x_{97.5\%}-\mu\)
\(\underline{\underline{\mu+z_{97.5\%}\cdot \sigma=x_{97.5\%}}}\)
Jetzt setzen wir die Werte in die umgestellte Formel ein:
\(\begin{aligned} x_{97.5\%} &= \mu+z_{97.5\%}\cdot \sigma\\ &= 100+1.96\cdot 10 = 119.6 \end{aligned}\)
Eine zufällig ausgewählte Person müsste mindestens den IQ-Wert von 120 aufweisen, um zu den besten 2,5% zu gehören.
Beachte: Die Antwort muss sinnvoll gerundet sein. Z.B. IQ-Werte gibt es nur als ganze Zahlen, also sollte man als Antwort den IQ-Wert von 120 angeben (und nicht 119.6). Auch 119 anzugeben wäre falsch, da dieser Wert unterhalb des Wertes 119.6 liegt und damit nicht zu den besten 2.5% gehört.
(b) Welchen IQ-Wert müsste eine zufällig ausgewählte Person mindestens aufweisen, um nicht zu den schlechtesten 5% zu gehören?
Wir skizzieren am Anfang eine \(z\)-Verteilung und markieren die Fläche, die den “besten” 95% der Verteilung entspricht (und damit die schlechtesten 5% der Verteilung nicht umfasst).
Dem gesuchten IQ-Wert entspricht in der \(z\)-Verteilung der Wert \(z_{5\%}\).
Der Tabelle der Standardnormalverteilung können wir den Wert \(z_{95\%}\) entnehmen, welcher symmetrisch zu dem gesuchten \(z\)-Wert ist. Unsere Tabelle führt erst \(z\)-Werte ab 50% auf. Da \(z_{5\%} = – z_{95\%}\) ist, können wir den Wert trotzdem ermitteln.
Dafür sollen wir den Wert in der Tabelle suchen, der am nächsten zu dem Wert \(F(z_{95\%})=.9500\) ist. In der Tabelle gibt es zwei Werte, die gleich entfernt von der gesuchten Wahrscheinlichkeit von 95% sind: \(F(1.64)=.9495\) und \(F(1.65)=.9505\).
Die \(z\)-Werte, die die schlechtesten 5% abschneiden, sind in dem Fall -1.64 und -1.65
Jetzt müssen wir uns für einen dieser \(z\)-Werte (also, -1.64 oder -1.65) entscheiden.
Dabei können wir uns daran orientieren, ob wir konservativ oder liberal vorgehen wollen.
Beachte: Konservativ und liberal kann von Kontext zu Kontext Unterschiedliches bedeuten. Dies müssen wir jedes Mal neu bestimmen und in Abhängigkeit davon uns für einen Wert entscheiden.
Jetzt können wir die Werte, die uns gegeben sind, in die umgestellte Formel der \(z\)-Standardisierung aus der Aufgabe a) einsetzen:
\(\begin{aligned} x_{5\%} &= \mu+z_{5\%}\cdot \sigma\\ &= 100-1.64\cdot 10 = 83.6 \end{aligned}\)
Eine zufällig ausgewählte Person müsste mindestens den IQ-Wert von 84 aufweisen, um nicht zu den schlechtesten 5% zu gehören.
(c) Wie wahrscheinlich ist es, dass eine zufällig ausgewählte Person einen IQ-Wert zwischen 80 und 120 hat?
Wie aus der Abbildung ersichtlich ist, wollen wir hier die blaue Fläche in der Mitte bestimmen.
Als erstes sollten wir die IQ-Werte standardisieren mit Hilfe der Formel der \(z\)-Standardisierung:
\(z_o= \frac{x_o-\mu}{\sigma}= \frac{120-100}{10}=2.00\)
\(z_u= \frac{x_u-\mu}{\sigma}= \frac{80-100}{10}=-2.00\)
Wir bestimmen als nächstes die Fläche unter der Dichtefunktion:
Die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person einen IQ-Wert zwischen 80 und 120 hat, beträgt ca. 95.4%.
(4) Klausuren
Sina hat in der Methoden I -Klausur insgesamt 78 Punkte und in der Bio-Klausur genau 35 Punkte erreicht.
Es wird angenommen, dass sich die Punkte beider Klausuren normal verteilen. In der ersten Klausur ist für die Vergleichspopulation der Psychologiestudenten im Mittel eine Leistung von 60 Punkten bei einer Standardabweichung von 8 Punkten zu erwarten. In der zweiten Klausur beträgt der Erwartungswert 40 Punkte bei einer Standardabweichung von 5 Punkten.
(a) Mit welcher Wahrscheinlichkeit würde ein zufällig ausgewählter Psychologiestudent in der Methoden I- Klausur schlechter abschneiden als Sina?
Wir suchen die Wahrscheinlichkeit, die als blaue Fläche in der folgenden Skizze dargestellt ist. Das ist die Wahrscheinlichkeit, höchstens den Wert 78 in der Methoden I -Klausur zu erzielen.
Wir standardisieren den Punktewert, den Sina in der Klausur erzielt hat:
\(z= \frac{x-\mu}{\sigma}= \frac{78-60}{8}=2.25\)
Wir schauen in der Tabelle der Standardnormalverteilung die Wahrscheinlichkeit nach, höchstens den Wert \(z=2.25\) zu erzielen:
\(P(x<78)= F(2.25)=.9878\)
(b) Mit welcher Wahrscheinlichkeit würde ein zufällig ausgewählter Psychologiestudent in der Bio-Klausur besser abschneiden als Sina?
Wir suchen hier die Wahrscheinlichkeit, die als blaue Fläche in der folgenden Skizze dargestellt ist. Das ist die Wahrscheinlichkeit, mindestens den Wert 35 in der Bio-Klausur zu erzielen.
Wir standardisieren den Punktewert, den Sina in der Klausur erzielt hat:
\(z= \frac{x-\mu}{\sigma}= \frac{35-40}{5}=-1.00\)
Wir schauen in der Tabelle der Standardnormalverteilung für \(z=-1.00\) nach:
\(F(-1.00)= 1-F(1.00)= 1-.8413= .1587\)
Jetzt bestimmen wir die gesuchte Wahrscheinlichkeit:
\(P(x>35)= 1- F(-1.00) =1-.1587=.8413\)
(c) Johann habe in der Bio-Klausur 43 Punkte erreicht. Mit welcher Wahrscheinlichkeit würde ein zufällig ausgewählter Psychologiestudent besser als Sina aber gleichzeitig schlechter als Johann abschneiden?
Wir suchen hier die Wahrscheinlichkeit, die als blaue Fläche in der folgenden Skizze dargestellt ist. Das ist die Wahrscheinlichkeit, mindestens den Wert 35 und höchstens den Wert 43 in der Bio-Klausur zu erzielen.
Wir standardisieren die Punktewerte von Johann und Sina:
\(z_{Sina}= \frac{x_{Sina}-\mu}{\sigma}= \frac{35-40}{5}=-1.00\)
\(z_{Johann}= \frac{x_{Johann}-\mu}{\sigma}= \frac{43-40}{5}=0.60\)
Wir schauen in der Tabelle der Standardnormalverteilung für \(z=-1.00\) und \(z=0.60\) nach:
\(F(-1.00)= 1-F(1.00)= 1-.8413= .1587\)
\(F(0.60)= .7257\)
Jetzt bestimmen wir die gesuchte Wahrscheinlichkeit:
\(P(35<x<43)= F(0.60)- F(-1.00)= .7257-.1587=.5670\)
Die Wahrscheinlichkeit, dass ein zufällig ausgewählter Psychologiestudent besser als Sina aber gleichzeitig schlechter als Johann abschneidet, beträgt 56.7%.
X sei eine normalverteilte Zufallsvariable mit einer Standardabweichung von \(\sigma\) = 15.
Die obere Grenze des um \(\mu\) symmetrischen 0.95-Referenzbereichs betrage \(x_0\) = 129.4 (Referenzbereich = Bereich, in dem die mittleren 95% aller Populationswerte liegen)
(a) Wie groß ist der Erwartungswert μ in der Population?
Diese Skizze veranschaulicht die in der Aufgabenstellung gegebenen Informationen:
Uns ist die obere Grenze des Bereichs gegeben, welcher die mittleren 95% der Verteilung umfasst. An den Rändern der Verteilung bleiben jeweils 2.5%, die außerhalb dieses Bereichs liegen. Das bedeutet, dass unterhalb des gegebenen Werts \(x_o=129.4\) 97.5% der Verteilung liegen.
Damit können wir den zugehörigen \(z\)-Wert bestimmen. Wir suchen in der Tabelle der Standardnormalverteilung die Wahrscheinlichkeit \(F(z_{97.5\%})= .9750\) und finden auf diese Weise den \(z\)-Wert: \(z=1.96\).
Jetzt können wir den Erwartungswert \(\mu\) in der Population bestimmen.
(b) Wie groß ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person einen x-Wert über 115 hat?
Wir suchen hier die Wahrscheinlichkeit, die durch die blau gefärbte Fläche abgebildet ist.
Zuerst standardisieren wir den \(x\)-Wert:
\(z= \frac{x-\mu}{\sigma}= \frac{115-100}{15}= 1.00\)
Dann bestimmen wir die Wahrscheinlichkeit, höchstens den Wert \(z=1.00\) zu haben, mit Hilfe der Tabelle der Standardnormalverteilung: \(F(1.00)= .8413\)
Danach können wir die gesuchte Wahrscheinlichkeit bestimmen:
\(P(x>115)= 1-F(1.00)= 1-.8413= .1587\)
Die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person einen \(x\)-Wert über 115 hat, beträgt 15.9%.
(c) Welchen x-Wert bräuchte eine zufällig ausgewählte Person mindestens, um in der Population zu den 10% mit den höchsten x-Werten zu gehören?
Wir suchen die Wahrscheinlichkeit, zu den besten 10% der Verteilung zu gehören.
Wir suchen zuerst den \(z\)-Wert, der die oberen 10% der Verteilung eingrenzt, d.h. unter dem sich 90% der Verteilung befinden.
Dann bestimmen wir den gesuchten \(x\)-Wert. Dafür stellen wir die Formel für die \(z\)-Standardisierung, wie in der Aufgabe 3a) bereits gezeigt.
\(x= \mu+z_{90\%}\cdot\sigma= 100+1.28\cdot 15= 119.2\)