Bivariate Verteilungen

Ein kurzer Überblick

Hier finden Sie weitere Informationen zu den im Artikel verwendeten Beispieldaten.

Bivariate Häufigkeitsverteilungen

Wenn wir nach dem Zusammenhang zwischen zwei Merkmalen in unseren Daten fragen, interessieren wir uns — statistisch gesprochen — für die bivariate Häufigkeitsverteilung:

Welche Kombinationen von Werten zweier Merkmale treten wie häufig auf?

Was ist eine bivariate Verteilung?

Zusammenhänge in bivariaten Verteilungen

Wann würden wir in einer solchen bivariaten Verteilung einen Zusammenhang erkennen und lassen sich unterschiedliche Formen von Zusammenhängen unterscheiden?

Ein Zusammenhang zwischen zwei Variablen liegt allgemein also vor, wenn die Verteilung der einen Variable (z.B. die der Mathenote) in Abhängigkeit von den Werten der anderen Variable (z.B. der Deutschnote) in irgendeiner Form unterschiedlich ausfällt. Wir sprechen von einer bedingten Verteilung: Wie bedingen die Werte der einen Variable die der anderen?

Zusammenhänge nach Skalenniveau der Variablen

Je nach Skalenniveau (und der Anzahl der Ausprägungen) der beiden Merkmale können bivariate Verteilungen ganz unterschiedlich aussehen. Auch unsere Vorstellungen davon, wie die verschiedenen Zusammenhangsformen "aussehen", unterscheiden sich.

Stärke des Zusammenhangs und statistische Maßzahlen

Neben der Richtung (positiv/negativ) und der Form (linear/nicht linear) interessiert uns die Stärke des Zusammenhangs: Bedingen die Ausprägungen des einen Merkmal die des anderen Merkmals zu einem großen Teil oder nur in kleinerem Ausmaß? Die Abbildungen zeigen unterschiedlich starke Zusammenhänge am Beispiel der Variablen Deutschnote und Mathenote.

Statistische Zusammenhangsmaße quantifizieren die Stärke des Zusammenhangs in einer Maßzahl. Zusammenhangsmaße sind in der Regel so konstruiert, dass der Wert 0 "kein Zusammenhang" bedeutet und der Wert "1" einen perfekten Zusammenhang beschreibt. Wenn auch die Richtung eine Rolle spielt, zeigt das Vorzeichen die Richtung des Zusammenhangs an.

Für die Werte zwischen Null und Eins finden sich für viele Zusammenhangsmaße "Faustregeln", welche Wertebereiche als "schwache", " mittelstarke", "starke" Zusammenhänge usw. interpretiert werden können.

Wie bei allen Kennzahl gehen in der Darstellung mit Maßzahlen Informationen über die zu Grunde liegenden Daten verloren. Insbesondere sagen Zusammenhangsmaße nichts über die Form des Zusammenhangs aus, sondern setzen Annahmen über diese voraus. So bilden viele Maßzahlen (wie z.B. die häufig als Synonym für "Zusammenhang" verwendete "(Produkt-Moment-)Korrelation") lineare je-desto-Zusammenhänge ab. Nicht immer zeigen sie das ganze Bild:

Übersicht über bivariate Zusammenhangsmaße

Für bivariate Zusammenhänge existieren viele unterschiedliche Maßzahlen, die je nach Skalenniveau der betrachteten Variablen und Art des Zusammenhangs (linear oder nonlinear?) auszuwählen sind. Die folgende Tabelle bietet einen Überblick über verschiedene Maßzahlen für bivariate Zusammenhänge:

ZusammenhangsmaßSkalenniveaus der beiden VariablenWertebereich AussagekraftBeispielmerkmale
Korrelationskoeffizient \(r\)Zwei kontinuierliche, d.h. metrische Variablen\(-1 Stärke und Richtung eines linearen ZusammenhangsPunktezahl Deutschtest; Schlafzeit in der Nacht davor
Cramérs \(V\)Mindestens zwei nominale Variablen\(0 Stärke eines ZusammenhangsIn der Freizeit ausgeübte Sportart; Sportnote
Spearmans Rangkorrelation \(\rho\) (rho)Mindestens zwei ordinale Variablen\(-1 Stärke und Richtung eines linearen ZusammenhangsDeutschnote; Mathenote
\(\eta^2\) (Eta-Quadrat)Eine metrische abhängige und eine nominale unabhängige Variable\(0 \leq \eta^2 \leq 1\)Stärke des ZusammenhangsPunktezahl Mathetest; Ist Mathematik Lieblingsfach (ja/nein)
Creative Commons Lizenzvertrag

Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung - Nicht-kommerziell - Weitergabe unter gleichen Bedingungen 4.0 International Lizenz.

Autor*innen dieses Artikels

Sebastian Gerhartz, Lisa Rüge

Diese Seite wurde zuletzt am 28.09.2021 aktualisiert.