📌 Übungsblatt 5 – Cheat Sheet

Hier die Lösung zum Blatt: EiMedBiom - Blatt 5


📊 1. Korrelation zwischen Zuckerkonsum und Karies

Thema: Untersuchung des Zusammenhangs zwischen Zuckerkonsum und Karies in verschiedenen Ländern.

a) Explorative Datenanalyse

  • Datensatz: Enthält die Variablen:

    • : Zuckerkonsum (kg/Person/Jahr).
    • : Durchschnittliche Anzahl kariöser, fehlender oder gefüllter Zähne.
    • : Indikator für Industrie-/Entwicklungsland.
  • Daten in R einlesen:

    data <- read.table("sugar_consumption.txt", header = TRUE)
  • Histogramme & Boxplots zur Verteilung von sugar und dmft:

    • Histogramm: hist(data$sugar)
    • Boxplot: boxplot(data$dmft)

b) Streudiagramm (Scatterplot)

  • Visualisierung der Beziehung zwischen Zuckerkonsum und Karies:
    plot(data$sugar, data$dmft, xlab="Zuckerkonsum", ylab="Karies (dmft)")
  • Interpretation: Gibt es eine sichtbare Korrelation?

c) Pearson-Korrelation

  • Korrelationskoeffizient nach Pearson berechnet den linearen Zusammenhang:
  • Berechnung in R:
    cor(data$sugar, data$dmft, method="pearson")
  • Interpretation: (positiver Zusammenhang) oder (negativer Zusammenhang)?

d) Spearman-Korrelation

  • Monotone Zusammenhänge statt nur lineare Beziehungen.
  • Berechnung:
    cor(data$sugar, data$dmft, method="spearman")
  • Vergleich mit Pearson-Korrelation: Gibt es große Unterschiede?

e) Streudiagramm mit Farbkodierung nach Ländergruppen

  • Industrie- vs. Entwicklungsländer farblich differenzieren:
    plot(data$sugar, data$dmft, col=ifelse(data$industrialized == 1, "blue", "red"))
    legend("topright", legend=c("Industrie", "Entwicklung"), col=c("blue", "red"), pch=1)
  • Interpretation: Gibt es systematische Unterschiede zwischen den Ländern?

📊 2. Vergleich zweier Messverfahren (Bland-Altman-Analyse)

Thema: Vergleich von zwei Messmethoden (A vs. B) zur Untersuchung der Messgenauigkeit.

a) Explorative Analyse

  • Einlesen der Daten:

    data <- read.csv2("Messungen.csv")
  • Übersicht über die Daten:

    summary(data)

b) Streudiagramm mit 45°-Linie

  • Vergleich der Methoden A und B:
    plot(data$A, data$B)
    abline(0,1, col="red")  # Ideale Übereinstimmungslinie
  • Interpretation: Wie stark weichen die Punkte von der roten Linie ab?

c) Bland-Altman-Plot

  • Differenz vs. Mittelwert beider Methoden:
    diff <- data$A - data$B
    meanAB <- (data$A + data$B) / 2
    plot(meanAB, diff)
    abline(h = mean(diff), col="red")
    abline(h = mean(diff) + 1.96*sd(diff), col="blue", lty=2)
    abline(h = mean(diff) - 1.96*sd(diff), col="blue", lty=2)
  • Interpretation:
    • Mittlere Differenz (Bias) → Ist eine Methode systematisch höher/niedriger?
    • LoA (Limits of Agreement) → Sind Unterschiede innerhalb akzeptabler Grenzen?

d) Log-Transformation zur Stabilisierung der Varianz

  • Falls Differenzen systematisch von der Größe der Messwerte abhängen:
    data$logA <- log(data$A)
    data$logB <- log(data$B)
    diff_log <- data$logA - data$logB
    mean_log <- (data$logA + data$logB) / 2
    plot(mean_log, diff_log)
  • Interpretation: Hat die Transformation das Problem gelöst?

📊 3. Zusammenhang zwischen Alkoholkonsum & kardiovaskulären Erkrankungen

Thema: Berechnung von Risiko & Relativem Risiko (RR) für kardiovaskuläre Mortalität in Abhängigkeit vom Bierkonsum.

a) Absolutes Risiko berechnen

  • Risiko für kardiovaskulären Tod pro Gruppe:

b) Relatives Risiko (RR)

  • Vergleich der Risiken zwischen Biertrinkern & Nicht-Trinkern: mit:
    • = Risiko für Beer Binger,
    • = Risiko für Nicht-Trinker.

c) 95% Konfidenzintervall für RR

  • Berechnung des Konfidenzintervalls für das RR mit:

📊 4. Zusammenhang zwischen Geburtsgewicht & Entwicklungsverzögerung

Thema: Berechnung des Odds Ratios (OR) für den Zusammenhang zwischen Geburtsgewicht und verzögerter Entwicklung.

a) Berechnung des Odds Ratios (OR)

  • Formel für OR aus der Vierfeldertafel: mit:
    • als Zellwerte der Tabelle.

b) Vergleich für unterschiedliche Bleibelastungen

  • Berechnung des OR für hohe/niedrige Bleibelastung.
  • Interpretation: Hat das Bleiniveau einen Einfluss auf den Zusammenhang zwischen Geburtsgewicht & Entwicklung?

c) Gesamtvergleich & Confounding

  • Vergleich der berechneten OR-Werte:
    • Unterscheiden sich die OR-Werte stark zwischen Gruppen?
    • Gibt es Hinweise auf Confounding durch Bleibelastung?

📌 Fazit

Korrelation: Pearson & Spearman zur Analyse von Zusammenhängen.
Bland-Altman-Analyse zur Bewertung der Messmethode.
Relatives Risiko (RR) und Odds Ratio (OR) zur Bewertung epidemiologischer Zusammenhänge.
Interpretation von Konfidenzintervallen für RR & OR.