📌 Übungsblatt 5 – Cheat Sheet
Hier die Lösung zum Blatt: EiMedBiom - Blatt 5
📊 1. Korrelation zwischen Zuckerkonsum und Karies
Thema: Untersuchung des Zusammenhangs zwischen Zuckerkonsum und Karies in verschiedenen Ländern.
a) Explorative Datenanalyse
-
Datensatz: Enthält die Variablen:
- : Zuckerkonsum (kg/Person/Jahr).
- : Durchschnittliche Anzahl kariöser, fehlender oder gefüllter Zähne.
- : Indikator für Industrie-/Entwicklungsland.
-
Daten in R einlesen:
data <- read.table("sugar_consumption.txt", header = TRUE)
-
Histogramme & Boxplots zur Verteilung von sugar und dmft:
- Histogramm:
hist(data$sugar)
- Boxplot:
boxplot(data$dmft)
- Histogramm:
b) Streudiagramm (Scatterplot)
- Visualisierung der Beziehung zwischen Zuckerkonsum und Karies:
plot(data$sugar, data$dmft, xlab="Zuckerkonsum", ylab="Karies (dmft)")
- Interpretation: Gibt es eine sichtbare Korrelation?
c) Pearson-Korrelation
- Korrelationskoeffizient nach Pearson berechnet den linearen Zusammenhang:
- Berechnung in R:
cor(data$sugar, data$dmft, method="pearson")
- Interpretation: (positiver Zusammenhang) oder (negativer Zusammenhang)?
d) Spearman-Korrelation
- Monotone Zusammenhänge statt nur lineare Beziehungen.
- Berechnung:
cor(data$sugar, data$dmft, method="spearman")
- Vergleich mit Pearson-Korrelation: Gibt es große Unterschiede?
e) Streudiagramm mit Farbkodierung nach Ländergruppen
- Industrie- vs. Entwicklungsländer farblich differenzieren:
plot(data$sugar, data$dmft, col=ifelse(data$industrialized == 1, "blue", "red")) legend("topright", legend=c("Industrie", "Entwicklung"), col=c("blue", "red"), pch=1)
- Interpretation: Gibt es systematische Unterschiede zwischen den Ländern?
📊 2. Vergleich zweier Messverfahren (Bland-Altman-Analyse)
Thema: Vergleich von zwei Messmethoden (A vs. B) zur Untersuchung der Messgenauigkeit.
a) Explorative Analyse
-
Einlesen der Daten:
data <- read.csv2("Messungen.csv")
-
Übersicht über die Daten:
summary(data)
b) Streudiagramm mit 45°-Linie
- Vergleich der Methoden A und B:
plot(data$A, data$B) abline(0,1, col="red") # Ideale Übereinstimmungslinie
- Interpretation: Wie stark weichen die Punkte von der roten Linie ab?
c) Bland-Altman-Plot
- Differenz vs. Mittelwert beider Methoden:
diff <- data$A - data$B meanAB <- (data$A + data$B) / 2 plot(meanAB, diff) abline(h = mean(diff), col="red") abline(h = mean(diff) + 1.96*sd(diff), col="blue", lty=2) abline(h = mean(diff) - 1.96*sd(diff), col="blue", lty=2)
- Interpretation:
- Mittlere Differenz (Bias) → Ist eine Methode systematisch höher/niedriger?
- LoA (Limits of Agreement) → Sind Unterschiede innerhalb akzeptabler Grenzen?
d) Log-Transformation zur Stabilisierung der Varianz
- Falls Differenzen systematisch von der Größe der Messwerte abhängen:
data$logA <- log(data$A) data$logB <- log(data$B) diff_log <- data$logA - data$logB mean_log <- (data$logA + data$logB) / 2 plot(mean_log, diff_log)
- Interpretation: Hat die Transformation das Problem gelöst?
📊 3. Zusammenhang zwischen Alkoholkonsum & kardiovaskulären Erkrankungen
Thema: Berechnung von Risiko & Relativem Risiko (RR) für kardiovaskuläre Mortalität in Abhängigkeit vom Bierkonsum.
a) Absolutes Risiko berechnen
- Risiko für kardiovaskulären Tod pro Gruppe:
b) Relatives Risiko (RR)
- Vergleich der Risiken zwischen Biertrinkern & Nicht-Trinkern:
mit:
- = Risiko für Beer Binger,
- = Risiko für Nicht-Trinker.
c) 95% Konfidenzintervall für RR
- Berechnung des Konfidenzintervalls für das RR mit:
📊 4. Zusammenhang zwischen Geburtsgewicht & Entwicklungsverzögerung
Thema: Berechnung des Odds Ratios (OR) für den Zusammenhang zwischen Geburtsgewicht und verzögerter Entwicklung.
a) Berechnung des Odds Ratios (OR)
- Formel für OR aus der Vierfeldertafel:
mit:
- als Zellwerte der Tabelle.
b) Vergleich für unterschiedliche Bleibelastungen
- Berechnung des OR für hohe/niedrige Bleibelastung.
- Interpretation: Hat das Bleiniveau einen Einfluss auf den Zusammenhang zwischen Geburtsgewicht & Entwicklung?
c) Gesamtvergleich & Confounding
- Vergleich der berechneten OR-Werte:
- Unterscheiden sich die OR-Werte stark zwischen Gruppen?
- Gibt es Hinweise auf Confounding durch Bleibelastung?
📌 Fazit
✅ Korrelation: Pearson & Spearman zur Analyse von Zusammenhängen.
✅ Bland-Altman-Analyse zur Bewertung der Messmethode.
✅ Relatives Risiko (RR) und Odds Ratio (OR) zur Bewertung epidemiologischer Zusammenhänge.
✅ Interpretation von Konfidenzintervallen für RR & OR.