Zusammenhang zwischen metrischen Variablen

Darstellung von Zusammenhängen

Zur Erinnerung: Je nach Skalenniveau der beiden Variablen lassen sich zwei Merkmale in unterschiedlicher Weise gemeinsam darstellen. Zwei metrische Variablen lassen sich in einem Punktdiagramm abbilden.

Punktdiagramme

Hier finden Sie Informationen zu den im Artikel verwendeten Beispieldaten

Korrelation

Der Korrelationskoeffizient \(r\) nach Bravais und Pearson - auch Produkt-Moment-Korrelation genannt - ist ein Maß für den linearen Zusammenhang zweier kontinuierlicher/metrischer Variablen.

Eigenschaften

  • \(r\) kann Werte zwischen \(-1\) und \(1\) annehmen.
  • Ein Wert von \(0\) bedeutet, dass kein Zusammenhang vorliegt.
  • Negative Werte repräsentieren einen negativen Zusammenhang, positive Werte weisen dementsprechend auf einen positiven Zusammenhang hin.
  • Je weiter der Wert von \(0\) entfernt ist, desto stärker ist der Zusammenhang.
  • Der untersuchte Zusammenhang wird als ungerichtet angenommen, d.h. es wird keine Wirkrichtung zwischen den Variablen festgelegt. Wir sprechen also nicht von abhängigen und unabhängigen Variablen.

Grundidee

Wir berechnen mit \(r\), ob und wie sehr über-(unter)durchschnittliche Werte auf einer Variablen mit über- oder unterdurchschnittlichen Werten auf der anderen Variablen einhergehen. Die Stärke dieses Zusammenhangs können wir mit \(r\) in einer konkreten Zahl ausdrücken.

Der Grund liegt in dem oben gezeigten Konstruktionsprinzip, den bivariaten Merkmalsraum (d.h. bildlich, die Fläche des Streudiagramms) anhand der Mittelwerte in vier Quadranten zu teilen - denn schon dieser Mittelwert allein kann für nicht-metrische Variablen nicht berechnet werden!

Interpretation

Zur Interpretation der Stärke des Zusammenhangs gibt es verschiedene Faustregeln, z.B. nach Kühnel & Krebs (2007, S. 404f.):

Stärke des ZusammenhangsWertebereich von r
Kein Zusammenhang\(0 < |r| < 0,05\)
Geringer Zusammenhang\(0,05 < |r| < 0,2\)
Mittlerer Zusammenhang\(0,2 < |r| < 0,5\)
Hoher Zusammenhang\(0,5 < |r| < 0,7\)
Sehr hoher Zusammenhang\(|r| > 0,7\)

Als Zusammenhangsmaß für metrische Variablen kann uns auch der Begriff der Kovarianz begegnen. Die Kovarianz wird zur Berechnung von r verwendet und ist unstandardisiert. Das bedeutet, dass die Größe der Kovarianz nicht nur von dem linearen Zusammenhang sondern auch von den Einheiten der Variablen abhängig ist. Im Vergleich zur Kovarianz können wir mit dem Korrelationskoeffizienten r also die Stärke eines Zusammenhangs besser beurteilen und verschiedene Zusammenhangshypothesen besser vergleichen.

Herleitung des Korrelationskoeffizienten nach Bravais und Pearson

Zusammenfassung

Praktische Umsetzung mit Statistiksoftware

Hier entsteht ein Abschnitt zu Analyse von Zusammenhängen metrischer Variablen in R.

Bei dringenden Fällen können Sie einen Termin zur Beratung vereinbaren.

Hier entsteht ein Abschnitt zu Analyse von Zusammenhängen metrischer Variablen in Stata.

Bei dringenden Fällen können Sie einen Termin zur Beratung vereinbaren.

Beispieldaten & SPSS-Syntax herunterladen: spss_zusammenhang_metrisch.zip

Datenbeispiel

Punktdiagramm und Pearsons Korrelationskoeffizient

Statt durch Klicken durch das Menü können wir uns die Ergebnisse auch über die Syntax ausgeben lassen. Für das Diagramm verwenden wir den folgenden Code:

GGRAPH 
  /GRAPHDATASET NAME="graphdataset" VARIABLES=schlafdauer punkte MISSING=LISTWISE REPORTMISSING=NO 
  /GRAPHSPEC SOURCE=INLINE 
  /FITLINE TOTAL=NO. 
BEGIN GPL 
  SOURCE: s=userSource(id("graphdataset")) 
  DATA: schlafdauer=col(source(s), name("schlafdauer")) 
  DATA: punkte=col(source(s), name("punkte")) 
  GUIDE: axis(dim(1), label("schlafdauer")) 
  GUIDE: axis(dim(2), label("punkte")) 
  GUIDE: text.title(label("Einfaches Streudiagramm  von punkte Schritt: schlafdauer")) 
  ELEMENT: point(position(schlafdauer*punkte)) 
END GPL.

Mit dem Befehl GGRAPH erzeugen wir die Abbildung und mit dem Befehl GPL modifizieren wir sie. Unter GRAPHDATASET vergeben wir einen Namen, auf den wir uns in dem GPL-Befehl beziehen. SOURCE=INLINE führt dazu, dass der momentan geöffnete Datensatz verwendet wird. Die x-Achse wird als dim(1) bezeichnet und die y-Achse als dim(2).

Für den Korrelationskoeffizienten verwenden wir den folgenden Code:

CORRELATIONS 
  /VARIABLES=punkte schlafdauer.

Wir verwenden den Befehl "CORRELATION" und geben mit "VARIABLES=" die Variablen an, für deren Zusammenhang wir uns interessieren.