📌 Übungsblatt 4 – Cheat Sheet

Hier die Lösung zum Blatt: EiMedBiom - Blatt 4


📊 1. Confounding & Logistische Regression

Thema: Untersuchung des Zusammenhangs zwischen Staubbelastung und chronischer Bronchitis unter Berücksichtigung von Raucherstatus und Expositionsdauer.

a) Datenüberblick

  • Datensatz: Enthält Variablen:
    • = chronische Bronchitis (ja/nein)
    • = Staubbelastung ()
    • = Raucherstatus (ja/nein)
    • = Belastungsdauer (Jahre)
  • Ziel: Explorative Datenanalyse, um Verteilungen und Zusammenhänge zu identifizieren.

b) Logistische Regression (unadjustiert)

  • Modellform:
  • Ziel: Untersuchung des Zusammenhangs zwischen Staubbelastung und Bronchitis ohne Confounder.

c) Logistische Regression (adjustiert)

  • Erweiterung des Modells:
  • Frage: Ist die Beziehung zwischen Staubbelastung und Bronchitis durch Rauchen/Belastungsdauer beeinflusst (Confounding)?

d) Wald-Test

  • Hypothesen:
    • → Kein Zusammenhang zwischen Staubbelastung und Bronchitis.
    • → Zusammenhang existiert.
  • Teststatistik: mit Standardfehler .
  • Ablehnung bei (z. B. 1.96 für ).

e) Interpretation der Regressionsergebnisse

  • Bedeutung der Regressionskoeffizienten:
    • : Zusammenhang von Staubbelastung und Bronchitis.
    • : Effekt von Rauchen auf Bronchitis.
    • : Effekt der Belastungsdauer.
  • Signifikanzbewertung: Ist , sind die Effekte statistisch signifikant.

📉 2. Hypothesentest für Geburtsgewicht

Thema: Vergleich des mittleren Geburtsgewichts von Babys von Risiko-Patientinnen mit dem bekannten Mittelwert aus der Literatur.

a) Hypothesenformulierung

  • Nullhypothese (): g (kein Unterschied zum bekannten Wert).
  • Alternativhypothese (): g (signifikanter Unterschied).

b) Teststatistik

  • t-Test für eine Stichprobe: wobei:
    • = beobachteter Mittelwert (3280 g),
    • = Standardabweichung (490 g),
    • = Stichprobengröße (20),
    • .

c) Testentscheidung

  • Vergleich der Teststatistik mit der kritischen Schranke:
    • Falls , dann Ablehnung von .

d) Interpretation

  • Falls verworfen wird → signifikanter Unterschied.
  • Falls beibehalten wird → kein statistisch signifikanter Unterschied.

📊 3. Family-Wise Error Rate (FWER) vs. False Discovery Rate (FDR)

Thema: Kontrolle der Fehlerwahrscheinlichkeit bei multiplen Tests.

a) Spezialfall

  • Wenn nur ein Test durchgeführt wird:
  • Interpretation:
    • FWER = Wahrscheinlichkeit, dass mindestens ein falsch-positives Ergebnis auftritt.
    • FDR = Erwarteter Anteil falsch-positiver Ergebnisse an allen signifikanten Befunden.

b) Allgemeine Beziehung

  • FWER ist konservativer als FDR.
  • FWER-Korrekturen (z. B. Bonferroni) sind strenger, während FDR-basierte Methoden (z. B. Benjamini-Hochberg) weniger konservativ sind.

📊 4. Vergleich zweier Therapieerfolge

Thema: Vergleich der Erfolgsraten einer neuen Therapie mit der Standardtherapie in einer klinischen Studie.

a) 2x2-Kreuztabelle

ErfolgKein ErfolgGesamt
Neue Therapie351550
Standardtherapie252550

b) Hypothesentest

  • Nullhypothese : Erfolgsraten sind gleich.
  • Alternativhypothese : Erfolgsraten unterscheiden sich.
  • Teststatistik (Chi-Quadrat-Test oder Z-Test): mit:
    • = beobachtete Erfolgsraten in beiden Gruppen,
    • = gepoolte Erfolgsrate.

c) p-Wert-Berechnung mit R

  • Vergleich des p-Werts mit , um zu prüfen, ob die Unterschiede signifikant sind.

📌 Fazit

Confounding & logistische Regression: Adjustierte vs. unadjustierte Schätzungen vergleichen.
Wald-Test zur Hypothesentestung in Regressionen.
Ein-Stichproben-t-Test zur Untersuchung von Mittelwertsunterschieden.
FWER vs. FDR: Multiples Testen und Fehlerkontrolle.
Vergleich von Therapieerfolgen mit Kreuztabellen und statistischen Tests.