4. Streudiagramme und Korrelation

Streudiagramme und Korrelation: Eine Einführung

1. Einführung

Streudiagramme und Korrelation sind grundlegende Werkzeuge der Statistik, die zur Visualisierung und Analyse von Beziehungen zwischen zwei quantitativen Variablen genutzt werden. Ein Streudiagramm zeigt Datenpunkte in einem kartesischen Koordinatensystem, wobei jede Achse eine der Variablen repräsentiert. Die Korrelation quantifiziert die Stärke und Richtung dieser Beziehung. Diese Konzepte sind entscheidend, um Muster in Daten zu erkennen und Hypothesen über kausale Zusammenhänge zu formulieren.

2. Anwendung

Streudiagramme und Korrelationen finden in zahlreichen Bereichen Anwendung:

  • Wirtschaft: Analyse von Zusammenhängen zwischen Verkaufszahlen und Werbeausgaben.
  • Medizin: Untersuchung der Beziehung zwischen Medikamentendosierung und Blutdruck.
  • Sozialwissenschaften: Erforschung der Korrelation zwischen Bildungsniveau und Einkommen.
  • Ökologie: Untersuchung des Zusammenhangs zwischen Temperatur und Pflanzenwachstum.

3. Aufbau / Bestandteile

Streudiagramm

Ein Streudiagramm besteht aus:

  • X-Achse und Y-Achse: Repräsentieren die zwei Variablen.
  • Datenpunkte: Jeder Punkt steht für ein Wertepaar der beiden Variablen.

Korrelation

Die Korrelation wird oft durch den Korrelationskoeffizienten ausgedrückt:

  • : Perfekte positive Korrelation.
  • : Perfekte negative Korrelation.
  • : Keine Korrelation.

4. Interpretation

Korrelationskoeffizient

Der Korrelationskoeffizient gibt an, wie stark und in welche Richtung zwei Variablen zusammenhängen. Ein positiver -Wert zeigt, dass mit steigender X-Werte auch die Y-Werte steigen, während ein negativer Wert das Gegenteil anzeigt. Es ist wichtig, Korrelation nicht mit Kausalität zu verwechseln – ein hoher Korrelationskoeffizient bedeutet nicht, dass die eine Variable die andere verursacht.

5. Praxisbeispiel

Angenommen, wir haben Daten zu den Lernstunden und den erzielten Noten von Schülern. Wir können ein Streudiagramm erstellen und den Korrelationskoeffizienten berechnen, um die Beziehung zwischen diesen Variablen zu untersuchen.

# Beispiel in R
# Daten
stunden <- c(2, 3, 5, 6, 8, 9, 11, 12, 14)
noten <- c(70, 75, 80, 85, 88, 90, 93, 95, 98)
 
# Streudiagramm
plot(stunden, noten, main="Streudiagramm von Lernstunden vs. Noten",
     xlab="Lernstunden", ylab="Noten", pch=19, col="blue")
 
# Korrelationskoeffizient
cor(stunden, noten)

Streudiagramm

6. Erweiterungen

  • Regressionsanalyse: Baut auf der Korrelation auf und modelliert die Beziehung zwischen Variablen.
  • Partielle Korrelation: Berücksichtigt die Auswirkungen anderer Variablen.
  • Nicht-lineare Korrelationen: Methoden wie Spearman’s Rangkorrelation sind nützlich, wenn die Beziehung nicht linear ist.

7. Fazit

Streudiagramme und Korrelationen sind essenzielle Werkzeuge zur Analyse von Datenbeziehungen. Sie bieten erste Einblicke, die durch weiterführende Analysen wie die Regressionsanalyse vertieft werden können. Wichtig ist, die Limitationen zu beachten, insbesondere die Unterscheidung zwischen Korrelation und Kausalität.

Für weiterführende Literatur empfehle ich die Bücher “Angewandte Statistik” von M. H. DeGroot und “Statistical Methods” von G. W. Snedecor.