Statistische Maßzahlen für die Form der Verteilung

Lage- und Streuungsmaße verraten uns viel über eine Verteilung, aber nicht alles. Nehmen wir einmal an, wir hätten für drei Gruppen von je \( n=1200 \) Schüler*innen die Punkte in ihrer letzte Mathe-Klausur erhoben. Wir finden die folgenden drei Häufigkeitsverteilungen:

Hier finden Sie Informationen zu den im Artikel verwendeten Beispieldaten

Wir sehen: Die Betrachtung statistischer Maßzahlen zu Lage und Streuung blendet wichtige Informationen über die Form der Verteilung aus. Obwohl Mittel- und Streuungswert auf eine Nachkommastelle genau gleich sind, liegen drei ganz unterschiedliche Verteilungen vor:

  1. Viele Schüler*innen der ersten Verteilung haben hohe Punktzahlen zwischen 50 und 60 Punkten erreicht, niedrigere Punktzahlen kommen seltener vor.

  2. Die Schüler*innen der zweiten Verteilung haben hauptsächlich Punktzahlen zwischen 45 und 55 Punkten erreicht. Kleinere und größere Punktzahlen kommen (gleichermaßen) seltener vor.

  3. Die Schüler*innen der dritten Verteilung haben am häufigsten 40 bis 50 Punkte erzielt, größere Punktzahlen kommen seltener vor.

Schiefe

Das Form-Merkmal, nach dem sich die gezeigten Verteilungen unterscheiden, wird als Schiefe oder Steilheit bezeichnet:

  • Die erste Verteilung ist linksschief bzw. rechtssteil. Ganz bildlich: auf der linken Seite ist die Verteilung eher schief, rechts "fällt sie steil ab".
  • Die zweite Verteilung ist ziemlich symmetrisch. Die Verteilung fällt links wie rechts vom Mittelwert ähnlich stark ab.
  • Die dritte Verteilung ist entprechend las rechtsschief oder linkssteil zu bezeichnen.

Vergleich von Median und arithmetischem Mittel

Eine einfache Möglichkeit, die Schiefe einer Verteilung anhand von Maßzahlen zu beurteilen besteht in einem Vergleich der beiden Lagemaße Median und arithmetisches Mittel.

folie3.png

Das gefundene Muster ist kein Zufall:

  • Bei einer linksschiefen Verteilung ist der Median immer größer als das arithmetische Mittel.
  • Bei einer symmetrischen verteilung fallen Median und arithmetisches Mittel zusammen.
  • Bei einer rechtsschiefen Verteilung ist der Median kleiner als das arithmetische Mittel.

Wir machen uns hier zu Nutze, dass das arithmetisches Mittel ausreißersensitiv ist, der Median aber nicht. Weit außen liegende Werte beeinflussen den Wert des arithmetischen Mittels stärker als den des Medians. In einer rechtsschiefen Verteilung "ziehen" die zwar wenigen, aber besonders hohen Werte das arithmetische Mittel "nach oben", den Median nicht.

Der Schiefekoeffizient

Die Schiefe einer Verteilung lässt sich auch über eine Maßzahl bestimmen. Sie wird meist als Schiefekoeffizient oder skewness bezeichnet.

Das Vorzeichen des Schiefekoeffizienten zeigt die Form der Schiefe an: Rechtsschiefe Verteilungen haben positive Schiefewerte, linkschiefe Verteilungen haben negative Schiefewerte. Ein Schiefekoeffizient von null zeigt eine perfekt symmetrische Verteilung an.

Der Betrag des Schiefekoeffizienten sollte in der Regel nicht interpretiert werden: Zwar weisen größere Beträge auf "stärker" rechts- oder linksschiefe Verteilungen hin, das genaue Bild der Verteilung lässt sich aber nicht gut ablesen.