Bivariate Verteilungen

Ein kurzer Überblick

Hier finden Sie weitere Informationen zu den im Artikel verwendeten Beispieldaten

Bivariate Häufigkeitsverteilungen

Wenn wir nach dem Zusammenhang zwischen zwei Merkmalen in unseren Daten fragen interessieren wir uns - statistisch gesprochen - für die bivariate Häufigkeitsverteilung:

Welche Kombinationen von Werten zweier Merkmale treten wie häufig auf?

Was ist eine bivariate Verteilung?

Zusammenhänge in bivariaten Verteilungen

Wann würden wir in einer solchen bivariaten Verteilung einen Zusammenhang erkennen, und lassen sich unterschiedliche Formen von Zusammenhängen unterscheiden?

Ein Zusammenhang zwischen zwei Variablen liegt allgemein also vor, wenn die Verteilung der einen Variable (z.B. die der Mathenote) in Abhängigkeit von den Werten der anderen Variable (z.B. der Deutschnote) in irgend einer Form unterschiedlich ausfällt. Wir sprechen von einer bedingten Verteilung: Wie bedingen die Werte der einen Variable die der anderen?

Zusammenhänge nach Skalenniveau der Variablen

Je nach Skalenniveau (und der Anzahl der Ausprägungen) der beiden Merkmale können bivariate Verteilungen ganz unterschiedlich aussehen, und auch unsere Vorstellungen davon, wie die verschiedenen Zusammenhangsformen "aussehen" unterscheiden sich.

Stärke des Zusammenhangs und statistische Maßzahlen

Neben der Richtung (positiv/negativ) und der Form (linear/nicht linear) interessiert uns die Stärke des Zusammenhangs: Bedingen die Ausprägungen des einen Merkmal die des anderen Merkmals zu einem großen Teil oder nur in kleinerem Ausmaß? Die Abbildungen zeigen unterschiedlich starke Zusammenhänge am Beispiel der Variablen Deutschnote und Mathenote.

Statistische Zusammenhangsmaße quantifizieren die Stärke des Zusammenhangs in einer Maßzahl. Zusammenhangsmaße sind in der Regel so konstruiert, dass der Wert 0 "kein Zusammenhang" bedeutet und der Wert "1" einen perfekten Zusammenhang beschreibt. Wenn auch die Richtung eine Rolle spielt zeigt das Vorzeichen die Richtung des Zusammenhangs an.

Für die Werte zwischen Null und Eins finden sich für viele Zusammenhangsmaße "Faustregeln", welche Wertebereiche als "schwache", " mittelstarke", "starke" Zusammenhänge usw. interpretiert werden können.

Wie bei allen Kennzahl gehen in der Darstellung mit Maßzahlen Informationen über die zu Grunde liegenden Daten verloren. Insbesondere sagen Zusammenhangsmaße nichts über die Form des Zusammenhangs aus, sondern setzen Annahmen über diese voraus. So bilden Viele Maßzahlen (wie z.B. die häufig als Synonym für "Zusammenhang" verwendete "(Produkt-Moment-)Korrelation" lineare je-desto-Zusammenhänge ab. Liegt tatsächlich ein nicht-linearer Zusammenhang vor, kann dieser mit einer solchen Maßzahl im schlechtesten Fall vollständig übersehen werden, wie das folgende Beispiel illustriert:

Grafik: u-förmiger Zusammenhang und linearer Zusammenhang.