statistische Maßzahlen für Lage und zentrale Tendenz

Einleitung

Mit statistischen Maßzahlen für Lage und zentrale Tendenz (auch Lagemaße genannt) können wir Aussagen darüber treffen, welche Werte ein Merkmal durchschnittlich annimmt. Die gängigsten Maßzahlen für die zentale Tendenz sind der Modalwert, der Median und das arithmetische Mittel. Welche dieser Maßzahlen wir für die Beschreibung einer bestimmten Verteilung verwenden, wird durch das Skalenniveau des Merkmals entschieden.

Mit Maßzahlen für die zentrale Tendenz können wir beispielsweise die folgenden Fragen beantworten:

  • Welche Punktezahl haben SchülerInnen in einem Deutschtest im Schnitt erreicht?

  • Welches ist die mittlere Anzahl an Stunden, welche SchülerInnen für einen Mathetest lernen?

  • Welche ist die von SchülerInnen in der Freizeit am häufigsten ausgeübte Sportart?

Bei allen drei aufgeführten Maßzahlen handelt es sich um Mittelwerte, da sie jeweils einen Mittelpunkt der Häufigkeitsverteilungen widerspiegeln. In einigen Fällen wird mit dem Begriff Mittelwert jedoch speziell das arithemtische Mittel genannt.

Modalwert/Modus

Der Modalwert (häufig auch Modus genannt) bezeichnet die Ausprägung, welche am häufigsten auftritt. In manchen Fällen ist er kein eindeutig bestimmbarer Wert. Falls mehr als eine Ausprägung am häufigsten vorkommt, existieren mehrere Modi. Der Modalwert kann für Merkmale aller Skalenniveaus bestimmt werden.

Beispiele

Median

Der Median beschreibt den mittleren Wert einer Variablen und wird daher auch Zentralwert genannt. Wir ordnen alle Werte der Variablen der Größe nach. Der Wert in der Mitte dieser geordneten Reihe ist der Median. Die Hälfte der Werte ist größer oder gleich dem Median. Notwendig ist mindestens ein ordinales Skalenniveau der Merkmale.

Beispiele

Berechnung des Medians

In diesem Abschnitt wird die Formel zur Berechnung des Medians erläutert.

Zur Berechnung des Medians werden alle Werte eines Merkmals der Größe nach sortiert, so wird beispielsweise aus diesen Werten der Mathenote einiger SchülerInnen \( 2;3;1;3;2;5;2 \) die geordnete Reihe \( 1;2;2;2;3;3;5 \). Der Median ist der Wert, der in der Mitte dieser Reihe liegt. In diesem Fall ist der Median \( 2 \).

\[ Median (n \: ungerade) = x_{(n+1)/2} = 2 \]

Bei einer ungeraden Anzahl von Beobachtungen gibt es diesen einzelnen Wert, der in der Mitte der Verteilung liegt. Bei einer geraden Anzahl an Werten werden entweder die beiden mittleren Werte angegeben oder es wird das arithmetische Mittel der beiden mittleren Werte berechnet. Beispielsweise ist der Median von \( 1;2;2;2;3;3;4;5 \) entweder \( { 2;3 } \) oder \( 2,5 \).

\[ Median (n \: gerade) = \{ x_{n/2} ; x_{(n/2)+1}) \} = \{ 2 ; 3 \} \]

oder

\[ Median (n \: gerade) = \frac{(x_{n/2} + x_{(n/2)+1})}{2} = (2 + 3) / 2 = 2,5 \]

Median aus einer Häufigkeitstabelle ablesen

Falls eine Häufigkeitstabelle mit relativen und kumulierten Häufigkeiten vorliegt, kann der Median einfach aus der Tabelle abgelesen werden. Bei der ersten Ausprägung, bei der die kumulierten Häufigkeiten einen Wert von \( 0,5 \) erreichen bzw. übersteigen, handelt es sich um den Median.

Für die Bestimmung des Medians müssen die Werte in eine Reihenfolge gebracht werden. Da nominale Variablen keine Rangfolge besitzen, kann der Median nur bei Merkmalen mit mindestens ordinalem Skalenniveau berechnet werden.

Arithmetisches Mittel

Das arithmetische Mittel beschreibt den durchschnittlichen Wert der Variablen. Wir berechnen die Summe aller Fälle und dividieren den Wert durch die Anzahl aller Fälle. Bezeichnet wird das arithmetische Mittel meist als \( \bar{x} \) (x-quer). Notwendig ist ein metrisches Skalenniveau der Merkmale.

Beispiele

Berechnung des arithmetischen Mittels

  In diesem Abschnitt wird die Formel zur Berechnung des arithmetischen Mittels erläutert.

Das arithmetische Mittel ergibt sich aus der Summe aller Werte dividiert durch die Anzahl der Werte.

\[ \bar{x} = \frac{\sum_{i=1}^n (x_i)}{n} \]

Für die erreichten Punkte in einem Mathetest \( 85,127,125,134,54,102 \) berechnen wir beispielsweise \( \bar{x} = \frac{85+127+125+134+54+102}{6} = \frac{627}{6} = 104,5 \). Die sechs SchülerInnen haben durchschnittlich 104,5 Punkte erreicht.

[zu ergänzen: Berechnung des arithmetischen Mittels aus einer Häufigkeitstabelle]

Zur Berechnung des arithmetischen Mittels wird metrisches Skalenniveau vorausgesetzt. Anders als beim Median wird hier nicht allein die Rangordnung der Werte berücksichtigt, sondern auch die Abstände zwischen den Werten. Abstände lassen sich bei nominalem und ordinalem Skalenniveau nicht sinnvoll interpretieren.

Die Summe aller Abweichungen vom arithmetischen Mittel beträgt 0.

Beispielberechnung

Mittelwerte im Vergleich

Aus den unterschiedlichen Berechnungsweisen folgen unterschiedliche Eigenschaften der drei Maßzahlen. Mit der folgenden interaktiven Anwendung können Sie prüfen, wie sich die Maßzahlen verändern, wenn bei Beispieldaten einzelne Fälle ausgeschlossen werden. Schließen Sie einzelne Fälle (z.B. Extremwerte) über die Schalter aus und beobachten Sie, wie sich arithmetisches Mittel, Median und Modus verändern!

Das arithmetische Mittel verändert sich deutlich in Abhängigkeit davon, ob extreme Werte in die Berechnung eingehen - wir nennen diese Eigenschaft anfällig für Ausreißer. Im Gegensatz dazu sind Median und Modus robust gegen Ausreißer.

Inferenzstatistik für arithmetisches Mittel: 1-Stichproben T-Test

Ist die Annahme gerechtfertigt, dass ein gefundener Mittelwert aus einer Grundgesamtheit mit bekanntem Mittelwert stammt?

Zusammenfassung