Skalenniveaus

(1) Skalenniveaus erkennen

Auf welchem Skalenniveau können die folgenden Merkmale am sinnvollsten gemessen werden? Wähle jeweils ein Skalenniveau!

  1. die Entfernung zwischen New York und anderen Städten in den USA
    □ Nominalskalenniveau
    □ Ordinalskalenniveau
    □ Intervallskalenniveau
    □ Verhältnisskalenniveau

  2. die Klassifikation für frisches Fleisch (ganz frisch; noch zum Verzehr geeignet; verdorben)
    □ Nominalskalenniveau
    □ Ordinalskalenniveau
    □ Intervallskalenniveau
    □ Verhältnisskalenniveau

  3. Körpertemperatur in Grad Celsius
    □ Nominalskalenniveau
    □ Ordinalskalenniveau
    □ Intervallskalenniveau
    □ Verhältnisskalenniveau

  4. Vorliegen einer Fahrerlaubnis für PKW
    □ Nominalskalenniveau
    □ Ordinalskalenniveau
    □ Intervallskalenniveau
    □ Verhältnisskalenniveau

  5. Beliebtheitsranking des Statistikunterrichts im Vergleich mit anderen Fächern
    □ Nominalskalenniveau
    □ Ordinalskalenniveau
    □ Intervallskalenniveau
    □ Verhältnisskalenniveau

  6. Herzrate
    □ Nominalskalenniveau
    □ Ordinalskalenniveau
    □ Intervallskalenniveau
    □ Verhältnisskalenniveau


Lösung

  1. die Entfernung zwischen New York und anderen Städten in den USA: Verhältnisskalenniveau
    \(\rightarrow\) Entfernungen sind immer verhältnisskaliert. Es gibt einen empirisch interpretierbaren Nullpunkt, denn 0 Meter bedeutet »keine Entfernung«. Die Abstände zwischen zwei Skalenpunkten sind festgelegt, d.h. 2 cm ist weiter entfernt von 4 cm als von 1 cm. (Da es auch einen absoluten Nullpunkt gibt, können wir hier sogar spezifizieren: 2 cm ist doppelt so weit entfernt von 4 cm wie von 1 cm.) Zudem sind 3 km offensichtlich mehr als 2 km, es gibt also eine Reihenfolge in den Ausprägungen der Variable. Allerdings gibt es unterschiedliche Maße der Entfernung, z.B. Meter und Kilometer, aber auch Yard, Zoll, Lichtjahre usw. Entfernungen sind also nicht absolutskaliert.

  2. die Klassifikation für frisches Fleisch (ganz frisch; noch zum Verzehr geeignet; verdorben): Ordinalskalenniveau
    \(\rightarrow\) Diese Variable ist ordinalskaliert, da wir eine Reihenfolge der Ausprägungen erkennen können: ganz frisches Fleisch ist am besten, danach kommt solches, das noch zum Verzehr geeignet ist, und schließlich verdorbenes Fleisch. Es wäre nicht logisch, »noch zum Verzehr geeignet« nach verdorbenem Fleisch anzuordnen. Allerdings liegen hier keine äquidistanten Skalenpunkte vor, d.h. zwei Fleischstücke sind nicht unbedingt »gleich« stark verdorben, nur weil sie beide verdorben sind, und somit sind sie auch nicht gleich weit entfernt von der Ausprägung »noch zum Verzehr geeignet«. Die Abstände sind also nicht interpretierbar und es liegt noch kein Intervallskalenniveau vor.

  3. Körpertemperatur in Grad Celsius: Intervallskalenniveau
    \(\rightarrow\) Wenn man Temperatur in Grad Celsius misst, gibt es keinen empirisch bedeutsamen Nullpunkt, denn wir haben im Winter regelmäßig auch Minusgrade. 0°C ist zwar die Temperatur, zu der Wasser gefriert, aber bedeutet nicht »keine Temperatur«. Somit ist dieses Temperaturmaß (im Gegensatz zu Grad Kelvin, wo 0° tatsächlich den absoluten Nullpunkt, also »keine Temperatur« kennzeichnet) nicht verhältnisskaliert. Jedoch sind die Abstände der Skalenpunkte gleich groß, z.B. bedeuten 5°C und 4°C einen gleich großen Temperaturunterschied wie 27°C und 28°C, sodass die Daten nicht nur aufgrund ihrer Rangfolge (10°C sind wärmer als -1°C) ordinal- sondern intervallskaliert sind.

  4. Vorliegen einer Fahrerlaubnis für PKW: Nominalskalenniveau
    \(\rightarrow\) Die Fahrerlaubnis liegt entweder vor oder liegt nicht vor, es handelt sich hierbei um ein natürlich dichotomes Merkmal. Üblicherweise werden Variablen mit nur zwei möglichen Ausprägungen als nominalskaliert eingeordnet, da im klassischen Sinne keine Reihenfolge vorliegt. Allerdings könnte man hierbei argumentieren, dass eine Fahrerlaubnis »besser« oder »mehr« sei als keine Fahrerlaubnis und somit die Daten ordinalskaliert seien. Praktisch ergäben sich daraus allerdings keine Implikationen, denn es könnte beispielsweise weiterhin nur sinnvollerweise der Modus, aber noch kein Median gebildet bzw. interpretiert werden.

  5. Beliebtheitsranking des Statistikunterrichts im Vergleich mit anderen Fächern: Ordinalskalenniveau
    \(\rightarrow\) Beliebtheit impliziert eindeutig eine Reihenfolge. In einem Ranking ist allerdings nicht klar, ob die Abstände gleich groß sind, d.h. ob beispielsweise Statistik nur ganz knapp Euer Lieblingsfach ist, während hinter dem darauf folgenden »Lernen & Gedächtnis« lange nichts folgt. Eine zusätzliche Information, die die Einordnung verändern würde, wären z.B. die Anzahl der Stimmen, aufgrund derer das Ranking entstanden ist.

  6. Herzrate: Verhältnisskalenniveau
    \(\rightarrow\) Wir können zwei Herzraten auf gleich/ungleich überprüfen, Werte in eine Reihenfolge bringen und die Abstände der Skala sinnvoll interpretieren. Zudem gibt es einen natürlichen Nullpunkt (eine Herzrate von 0 bedeutet »kein Herzschlag«). Allerdings gibt es unterschiedliche Einheiten, denn wir können die Herzrate zum Beispiel im Verhältnis zur Minute, Stunde usw. messen, aber nicht als absolute Anzahl. Daher ist die Herzrate verhältnisskaliert.

Hier eine Übersicht zu den Skalenniveaus, die möglicherweise hilfreich ist:

Niveau Definiert Zulässige Transformationen Mittelwert
Nominal Häufigkeit sowie Gleichheit/ Ungleichheit Alle eineindeutigen Transformationen Modus
Ordinal zusätzlich: Rangordnung streng-monoton-steigende Transformationen zusätzlich: Median
Intervall zusätzlich: Differenzen/Abstände lineare Transformationen
(\(y=a \cdot x+b\) )
zusätzlich: arithmetisches Mittel (Mittelwert)
Verhältnis zusätzlich: absoluter Nullpunkt sowie Quotienten/ Produkte proportionale Transformationen
(\(y=a \cdot x\))
zusätzlich: geometrisches Mittel


(2) Zulässige Aussagen

Die Punkte A, B, C und D wurden auf Intervallskalenniveau gemessen. Welche der folgenden Aussagen können wir auf dieser Grundlage treffen?
Wähle die richtige(n) Aussage(n) aus!

  1. A ist halb so groß wie B.
  2. C ist x-iger als B. (Wenn diese Skala zum Beispiel Grad in C° abbilden würde: C ist wärmer als B.)
  3. Der Abstand zwischen A und B ist genauso groß wie der Abstand zwischen C und D.
Lösung

  1. A ist halb so groß wie B.(Wenn diese Skala zum Beispiel Grad in C° abbilden würde: C ist wärmer als B.) \(\rightarrow\) FALSCH. Für solche Aussagen müssen die Daten mindestens auf Verhältnisskalenniveau vorliegen. Zum Multiplizieren und Dividieren müssen die Verhältnisse interpretierbar sein und dies ist nur der Fall, wenn die Skala einen natürlichen Nullpunkt abbildet.
  2. C ist x-iger als B. \(\rightarrow\) RICHTIG. Diese Aussage wäre bereits auf Ordinalskalenniveau zulässig, da eine Reihenfolge besteht.
  3. Der Abstand zwischen A und B ist genauso groß wie der Abstand zwischen C und D. \(\rightarrow\) RICHTIG. Abstände sind für Daten, die mindestens intervallskaliert sind, sinnvoll interpretierbar.


(3) Stetig vs. diskret

  1. Ordne folgenden Merkmalen das jeweils höchstmögliche Skalenniveau zu:
  • Reaktionszeit
  • Augenfarbe
  • Alter
  • Bildungsabschluss
  • Anzahl von Buchseiten
  1. Entscheide nun, ob die oben genannten Variablen stetig oder diskret sind!
Lösung

  1. Skalenniveau
  • Reaktionszeit \(\rightarrow\) Verhältnisskala: Eindeutiges »Mehr« (klare Rangfolge), äquidistante Skalenpunkte (interpretierbare Abstände, also eine metrische Variable, d.h. mindestens intervallskaliert), absoluter Nullpunkt.
  • Augenfarbe \(\rightarrow\) Nominalskala: Grün ist nicht besser als Braun.
  • Alter \(\rightarrow\) Verhältnisskala: Eindeutiges »Mehr«, äquidistante Skalenpunkte, absoluter Nullpunkt. Wir können das Alter in unterschiedlichen Einheiten messen (Tage, Monate, Hundejahre).
  • Bildungsabschluss \(\rightarrow\) Ordinalskala: Die Reihenfolge ist gegeben, aber die unterschiedlichen Abschlüsse sind nicht gleich weit voneinander entfernt, denn die Ausbildungszeit unterscheidet sich.
  • Anzahl von Buchseiten \(\rightarrow\) Absolutskala: Häufigkeiten sind als natürliche »Einheit« im Allgemeinen absolutskaliert. Es gibt eine klare Reihenfolge, jede Anzahl ist gleich weit von der nächsthöheren entfernt und 0 Seiten bedeuten »keine Seiten«. Durch Transformationen würden wir den Großteil der Information verlieren.
  1. Diskret vs. stetig
  • Reaktionszeit: stetig (wir könnten theoretisch unendlich »hineinzoomen«)
  • Augenfarbe: diskret/stetig (wir könnten entweder in normalen Farbkategorien messen oder aber in Farbsystemen)
  • Alter: stetig (die Zeit verläuft stetig und somit auch unser Alter - wir können sie unendlich genau messen)
  • Bildungsabschluss: diskret (man hat einen Abschluss oder man hat ihn nicht)
  • Anzahl von Buchseiten: diskret (gegeben, dass es keine halben und drittel Seiten gibt…)



Transformationen

(4) Transformationen der Variable »Form psychischer Störungen«

Welche der folgenden Transformationen der Ausprägungen der Variablen X = »Form der psychischen Störung« sind zulässig?

Wähle die richtige(n) Antwort(en) aus!

□ Eineindeutige Transformationen
□ Streng monoton steigende Transformationen
□ Positiv-lineare Transformationen
□ Ähnlichkeitstransformationen (proportionale Transformationen)
□ keine der genannten Optionen

Lösung

\(\checkmark\) Eineindeutige Transformationen
\(\checkmark\) Streng monoton steigende Transformationen
\(\checkmark\) Positiv-lineare Transformationen
\(\checkmark\) Ähnlichkeitstransformationen (proportionale Transformationen)

Alle genannten Transformationen sind für die Variable »Form der psychischen Störung« zulässig.  Die Variable ist nominalskaliert, denn psychische Störungen lassen sich nicht in eine Rangfolge bringen; eine psychische Störung ist nicht »mehr« als eine andere. Auf Nominalskalenniveau sind alle eineindeutigen Transformationen zulässig, d.h. solange die Information erhalten bleibt, welche Personen bzw. Beobachtungseinheiten dieselbe psychische Störung haben und welche eine andere, dürfen die Werte des numerischen Relativs verändert werden. Wir müssen z.B. weiterhin erkennen können, dass Frau B. eine Spinnenphobie hat, Herr R. eine Schizophrenie und Herr S. und Frau K. eine Zwangsstörung. Den unterschiedlichen Störungen können beliebige Zahlen oder sogar Symbole zugeordnet werden, solange eindeutig zu erkennen ist, dass Frau B. eine andere psychische Störung als Herr R. und als Herr S. und Frau K. hat (und Herr S. und Frau K. dieselbe).
Alle Ähnlichkeitstransformationen, positiv-linearen Transformationen und streng monoton steigenden Transformationen sind zugleich auch eineindeutige Transformationen, sie haben lediglich weitere Beschränkungen. Daher sind für die Variable alle genannten Transformationen zulässig.


(5) Transformationen & Skalentypen

Welche der folgenden Transformationen sind bei den Skalentypen a) bis e) möglich? Wähle die korrekte(n) Option(en) aus!

  1. Nominalskalenniveau
    □ Eineindeutige Transformationen
    □ Streng monoton steigende Transformationen
    □ Positiv-lineare Transformationen
    □ Ähnlichkeitstransformationen (proportionale Transformationen
    □ keine der genannten Optionen

  2. Ordinalskalenniveau
    □ Eineindeutige Transformationen
    □ Streng monoton steigende Transformationen
    □ Positiv-lineare Transformationen
    □ Ähnlichkeitstransformationen (proportionale Transformationen
    □ keine der genannten Optionen

  3. Intervallskalenniveau
    □ Eineindeutige Transformationen
    □ Streng monoton steigende Transformationen
    □ Positiv-lineare Transformationen
    □ Ähnlichkeitstransformationen (proportionale Transformationen
    □ keine der genannten Optionen

  4. Verhältnisskalenniveau
    □ Eineindeutige Transformationen
    □ Streng monoton steigende Transformationen
    □ Positiv-lineare Transformationen
    □ Ähnlichkeitstransformationen (proportionale Transformationen
    □ keine der genannten Optionen

  5. Absolutskalenniveau
    □ Eineindeutige Transformationen
    □ Streng monoton steigende Transformationen
    □ Positiv-lineare Transformationen
    □ Ähnlichkeitstransformationen (proportionale Transformationen
    □ keine der genannten Optionen

Lösung

  1. Nominalskalenniveau
    Alle genannten Transformationen sind für nominalskalierte Daten zulässig. Die eineindeutigen Transformationen umfassen alle weiteren genannten Transformationen und erhalten die Unterscheidung »gleich/ungleich«. Dadurch geht keine Information der Daten verloren.
  2. Ordinalskalenniveau
    Hier sind alle streng monoton steigenden Transformationen zulässig, inklusive positiv-linearer Transformationen und Ähnlichkeitstransformationen. Es handelt sich um Umformungen nach der Gleichung \(a + b \cdot x^c\). In diesen Transformationen bleibt zusätzlich zu der »gleich/ungleich«-Information die Reihenfolge erhalten.
  3. Intervallskalenniveau
    Auf Intervallskalenniveau sind alle positiv-linearen Transformationen (\(a + b \cdot x\)) und somit auch alle Ähnlichkeitstransformationen möglich, ohne dass Information verloren geht. Durch diese Transformationen behalten wir nämlich die gleich großen Abstände der Skalenpunkte bei.
  4. Verhältnisskalenniveau
    Verhältnisskalierte Daten dürfen nur Ähnlichkeitstransformationen, sogenannten proportionalen Transformationen unterzogen werden. Mit Umformungen nach der allgemeinen Gleichung \(\enspace b \cdot x \enspace\) bleibt der Nullpunkt unverändert, genau wie die Reihenfolge und die Abstände der Datenpunkte auf der Skala.
  5. Absolutskalenniveau
    Hier muss die Option »keine der genannten Optionen« gewählt werden, da absolutskalierte Daten in natürlichen Maßen vorliegen. Sehr häufig handelt es sich dabei um Anzahlen. Beispielsweise ist es eine ganz andere Information, dass eine Person 3 Kinder vs. dass sie 6 Kinder hat. Es sind keine Transformationen möglich, wenn gleichzeitig alle Informationen der Daten erhalten bleiben sollen.

  • Jede proportionale Transformation ist auch eine lineare, ist auch eine streng monotone, ist auch eine eineindeutige Transformation.
  • Aber nicht jede eineindeutige Transformation ist auch eine streng monoton steigende. Nicht jede streng monoton steigende Transformation ist auch eine lineare. Und nicht jede lineare Transformation ist auch eine proportionale.



Anwendung

(6) Anstrengende Verwandte…

Dein Vater ist begeistert von Deinem Studium und möchte sich auch an der Empirie versuchen. Er misst dazu die Anzahl der Stunden, die Babies aus seinem Freundeskreis am Tag schreien (subjektive Einschätzung des Elternteils). Folgende numerische Werte erhält er:

20, 5, 3, 0, 1, 1, 6, 24, 2, 0, 6, 7, 3, 4, 10

Da ihm große Zahlen nicht so geheuer sind, möchte er die Werte transformieren.
Was rätst Du Deinem Vater?

Lösung

Hier gibt es nicht »die« richtige Lösung. Dies wird Dir in der Forschungspraxis häufig passieren; je nachdem, welche Fragestellung Du untersuchst und worauf Du den Schwerpunkt legst, kannst Du Dich zwischen unterschiedlichen Varianten entscheiden. Es folgen ausgewählte Aspekte, die zu bedenken sind:

  • Transformieren ist hier zwar möglich, allerdings gelangen wir dann natürlich zu einer anderen Einheit, also nicht mehr Stunden.
  • Es stellt sich die Frage, ob Dein Vater damit besser rechnen könnte, denn wahrscheinlich lassen sich Brüche nicht vermeiden.
  • Sofern die Einheit nicht verändert werden »darf«, ist es eine Absolutskala, aber generell eine Verhältnisskala. Denn wir könnten genauso gut messen, wie viel ein Kind pro Minute, pro Tag oder pro Woche schreit. Transformationen sind also theoretisch möglich. Der*die Forschende muss beurteilen, ob eine Veränderung der Einheit eine inhaltliche Veränderung darstellt.
  • Die Variable könnte auch »herunterskaliert« werden auf ein Ordinalskalenniveau, beispielsweise durch Einteilen in »gar nicht«, »ein bisschen« (< 6 Stunden) und »viel« (> 6 Stunden). Damit könnte Dein Vater möglicherweise besser umgehen, allerdings muss man hierbei den massiven Informationsverlust bedenken.
  • Man könnte die Variable auch dichotomisieren: »schreit nicht« vs. »schreit« \(\rightarrow\) Auch hier ist der Informationsverlust zu bedenken. Es ist umstritten, ob dichotome Variablen nicht generell nominalskaliert sind. Wir könnten die Variable entweder als nominal- oder als ordinalskaliert betrachten.


(7) Entscheidungsbaum

Wie bestimme ich, auf welchem Skalenniveau eine Variable liegt?
Nimm Dir etwas Zeit zum Überlegen, welche Aspekte relevant sind. Dann erstelle einen Entscheidungsbaum!

Lösung

Hierbei gibt es nicht »die« richtige Lösung. Relevante Aspekte (der Reihenfolge nach) sind:

  • Gibt es ein besser/schlechter bzw. mehr/weniger bei der Variable? \(\rightarrow\) Nein: Nominalskala
  • Kann man sagen, dass es zur nächsten Stufe immer gleich viel mehr wird? \(\rightarrow\) Nein: Ordinalskala
  • Gibt es einen natürlichen Nullpunkt (nicht-vorhanden-Sein des Merkmals/Stillstand)? \(\rightarrow\) Nein: Intervallskala
  • Handelt es sich um Anzahlen/absolute Häufigkeiten ohne bzw. mit ganz fixer Einheit? \(\rightarrow\) Nein: Verhältnisskala; Ja: Absolutskala

\(\rightarrow\) Letztlich geht es darum, zu erkennen, was die Variable repräsentiert/repräsentieren soll.
Hier eine Beispiellösung:


(8) Philosophie

Hat überhaupt jede Variable genau ein feststehendes Skalenniveau?

Lösung

Nein. Sie hat ein maximales Skalenniveau, abhängig davon, was sie repräsentiert. Aber man kann jede (höher als nominalskalierte) Variable auf ein geringeres Niveau bringen (nimmt dann allerdings Informationsverlust in Kauf).

Das Skalenniveau kann immer nach »unten« transformiert werden.
Ein Merkmal, welches Verhältnisskalenniveau besitzt, kann auch als Intervall-, als Ordinal- oder als Nominalskala aufgefasst werden.
Nach »oben« kann aber nicht transformiert werden.