Zwei metrische Variablen

Darstellung von Zusammenhängen

Zur Erinnerung: Je nach Skalenniveau der beiden Variablen lassen sich zwei Merkmale in unterschiedlicher Weise gemeinsam darstellen. Zwei metrische Variablen lassen sich in einem Punktdiagramm abbilden.

Punktdiagramme

Korrelation

Der Korrelationskoeffizient \(r\) nach Bravais und Pearson - auch Produkt-Moment-Korrelation genannt - ist ein Maß für den linearen Zusammenhang zweier kontinuierlicher/metrischer Variablen.

Eigenschaften

  • \(r\) kann Werte zwischen \(-1\) und \(1\) annehmen.
  • Ein Wert von \(0\) bedeutet, dass kein Zusammenhang vorliegt.
  • Negative Werte repräsentieren einen negativen Zusammenhang, positive Werte weisen dementsprechend auf einen positiven Zusammenhang hin.
  • Je weiter der Wert von \(0\) entfernt ist, desto stärker ist der Zusammenhang.
  • Der untersuchte Zusammenhang wird als ungerichtet angenommen, d.h. es wird keine Wirkrichtung zwischen den Variablen festgelegt. Wir sprechen also nicht von abhängigen und unabhängigen Variablen.

Vorgehen

Das grobe Vorgehen ist folgendermaßen: Wir berechnen mit \(r\), ob und wie sehr überdurchschnittliche Werte auf einer Variablen mit über- oder unterdurchschnittlichen Werten auf der anderen Variablen einhergehen. Diesen Zusammenhang können wir mit \(r\) als eine konkrete Zahl ausdrücken.

Das ist genau der Grund, warum r nur für metrische Variablen verwendet werden kann. Ein "Durchschnitt" macht für niedrigere Skalenniveaus keinen Sinn.

Interpretation

Zur Interpretation der Stärke des Zusammenhangs gibt es verschiedene Faustregeln, z.B. nach Kühnel & Krebs (2007, S. 404f.):

Stärke des ZusammenhangsWertebereich von r
Kein Zusammenhang\(0 < |r| < 0,05\)
Geringer Zusammenhang\(0,05 < |r| < 0,2\)
Mittlerer Zusammenhang\(0,2 < |r| < 0,5\)
Hoher Zusammenhang\(0,5 < |r| < 0,7\)
Sehr hoher Zusammenhang\(|r| > 0,7\)

[Übersicht: Verschiedene scatterplots und die zugehörigen Korrelationskoeffizienten]

Falls eine Richtung festgelegt werden kann, könnte auch eine einfache lineare Regression genutzt werden, um den Zusammenhang zweier Merkmale zu bestimmen. Ein Vorteil dieses Verfahrens wäre etwa, dass wir damit Vorhersagen über die Ausprägung der abhängigen Variable in Abhängigkeit von bestimmten Werten der unabhängigen Variable treffen können.

Als Zusammenhangsmaß für metrische Variablen kann uns auch der Begriff der Kovarianz begegnen. Die Kovarianz wird zur Berechnung von r verwendet und ist unstandardisiert. Das bedeutet, dass die Größe der Kovarianz nicht nur von dem linearen Zusammenhang sondern auch von den Einheiten der Variablen abhängig ist. Im Vergleich zur Kovarianz können wir mit dem Korrelationskoeffizienten r also die Stärke eines Zusammenhangs besser beurteilen und verschiedene Zusammenhangshypothesen besser vergleichen.

Herleitung des Korrelationskoeffizienten nach Bravais und Pearson