Zwei nominale/ordinale Variablen

Darstellung von Zusammenhängen

Zur Erinnerung: Je nach Skalenniveau der beiden Variablen lassen sich zwei Merkmale in unterschiedlicher Weise gemeinsam darstellen. Für zwei nominale oder ordinale Variablen bieten sich Kreuztabellen an.

Kreuztabellen

Cramérs V

Wenn wir den Zusammenhang zwischen zwei nominalskalierten Variablen beschreiben wollen, können wir Cramérs \(V\) verwenden.

Eigenschaften

  • Cramérs \(V\) kann Werte zwischen \(0\) und \(1\) annehmen.
  • Ein Wert von \(0\) bedeutet, dass kein Zusammenhang vorliegt.
  • Je größer der Wert ist, desto größer ist der untersuchte Zusammenhang.

Vorgehen

Das grobe Vorgehen ist folgendermaßen: Wir vergleichen die beobachteten Häufigkeiten in den einzelnen Zellen der Kreuztabelle mit den Häufigkeiten, die ohne einen Zusammenhang der beiden Variablen zu Stande kommen würden. Der Wert von Cramérs \(V\) drückt den Unterschied zwischen diesen beiden Tabellen aus.

Im Gegensatz zum zuvor beschriebenen Korrelationskoeffizienten \(r\) untersuchen wir mit Cramérs \(V\) keinen linearen Zusammenhang. Aussagen wie "Je mehr Lernzeit SchülerInnen investieren, desto höher ist im Durchschnitt die Punktezahl" können also nicht getroffen werden - "mehr" und "höher" sind ja auch keine sinnvollen Begriffe für nominale Variablen. Dennoch kann uns interessieren, ob bestimmte Werte der einen nominalen Variable häufiger gemeinsam mit bestimmten Werten der anderen nominalen Variable auftreten.

Als Zusammenhangsmaß für nominale Variablen kann uns auch der Kontingenzkoeffizient C begegnen. Er wird ähnlich wie Cramérs V berechnen, ist jedoch unstandardisiert. Das bedeutet, dass für C kein einheitlicher Wertebereich (z.B. von 0 bis 1) existiert. Dadurch lässt sich C schlechter interpretieren als Cramérs V.

Für den Sonderfall von zwei dichotomen Variablen kann auch das Maß der Prozentsatzdifferenz verwendet werden.

Herleitung von Cramérs V

Rangkorrelation nach Spearman

Das zuvor beschriebene Maß Cramérs \(V\) können wir auch für die Beschreibung des Zusammenhangs zweier ordinalskalierter Variablen verwenden. Allerdings wird dabei nicht berücksichtigt, dass die Ausprägungen ordinaler Merkmale eine Rangfolge besitzen. Daher gehen bei der Verwendung von Cramérs \(V\) für ordinalskalierte Variablen Informationen verloren. Das Maß der Rangkorrelation \(\rho\) (rho) nach Spearman berücksichtigt hingegen, dass die Ausprägungen der Merkmale eine Rangfolge besitzen.

Eigenschaften

  • \(\rho\) kann Werte zwischen \(-1\) und \(1\) annehmen.
  • Ein Wert von \(0\) bedeutet, dass kein Zusammenhang vorliegt.
  • Je weiter der Wert von \(0\) entfernt ist, desto größer ist der Zusammenhang.
  • Negative Werte repräsentieren einen negativen Zusammenhang, positive Werte weisen dementsprechend auf einen positiven Zusammenhang hin.

Vorgehen

Das grobe Vorgehen ist folgendermaßen: Den beobachteten Werten der Merkmale werden Ränge zugeordnet. Größere Werte erhalten einen höheren Rang als kleinere Werte. Mit \(\rho\) vergleichen wir die Ränge beider Merkmale und berechnen daraus einen Wert, der den Zusammenhang widerspiegelt.

Als Zusammenhangsmaß für ordinale Variablen kann uns auch Kendalls Tau begegnen. Wie bei Spearmans Rho werden die Ränge der beobachteten Werte genutzt, die Art der Berechnung ist jedoch unterschiedlich.