📌 Übungsblatt 4 – Cheat Sheet
Hier die Lösung zum Blatt: EiMedBiom - Blatt 4
📊 1. Confounding & Logistische Regression
Thema: Untersuchung des Zusammenhangs zwischen Staubbelastung und chronischer Bronchitis unter Berücksichtigung von Raucherstatus und Expositionsdauer.
a) Datenüberblick
- Datensatz: Enthält Variablen:
- = chronische Bronchitis (ja/nein)
- = Staubbelastung ()
- = Raucherstatus (ja/nein)
- = Belastungsdauer (Jahre)
- Ziel: Explorative Datenanalyse, um Verteilungen und Zusammenhänge zu identifizieren.
b) Logistische Regression (unadjustiert)
- Modellform:
- Ziel: Untersuchung des Zusammenhangs zwischen Staubbelastung und Bronchitis ohne Confounder.
c) Logistische Regression (adjustiert)
- Erweiterung des Modells:
- Frage: Ist die Beziehung zwischen Staubbelastung und Bronchitis durch Rauchen/Belastungsdauer beeinflusst (Confounding)?
d) Wald-Test
- Hypothesen:
- → Kein Zusammenhang zwischen Staubbelastung und Bronchitis.
- → Zusammenhang existiert.
- Teststatistik: mit Standardfehler .
- Ablehnung bei (z. B. 1.96 für ).
e) Interpretation der Regressionsergebnisse
- Bedeutung der Regressionskoeffizienten:
- : Zusammenhang von Staubbelastung und Bronchitis.
- : Effekt von Rauchen auf Bronchitis.
- : Effekt der Belastungsdauer.
- Signifikanzbewertung: Ist , sind die Effekte statistisch signifikant.
📉 2. Hypothesentest für Geburtsgewicht
Thema: Vergleich des mittleren Geburtsgewichts von Babys von Risiko-Patientinnen mit dem bekannten Mittelwert aus der Literatur.
a) Hypothesenformulierung
- Nullhypothese (): g (kein Unterschied zum bekannten Wert).
- Alternativhypothese (): g (signifikanter Unterschied).
b) Teststatistik
- t-Test für eine Stichprobe:
wobei:
- = beobachteter Mittelwert (3280 g),
- = Standardabweichung (490 g),
- = Stichprobengröße (20),
- .
c) Testentscheidung
- Vergleich der Teststatistik mit der kritischen Schranke:
- Falls , dann Ablehnung von .
d) Interpretation
- Falls verworfen wird → signifikanter Unterschied.
- Falls beibehalten wird → kein statistisch signifikanter Unterschied.
📊 3. Family-Wise Error Rate (FWER) vs. False Discovery Rate (FDR)
Thema: Kontrolle der Fehlerwahrscheinlichkeit bei multiplen Tests.
a) Spezialfall
- Wenn nur ein Test durchgeführt wird:
- Interpretation:
- FWER = Wahrscheinlichkeit, dass mindestens ein falsch-positives Ergebnis auftritt.
- FDR = Erwarteter Anteil falsch-positiver Ergebnisse an allen signifikanten Befunden.
b) Allgemeine Beziehung
- FWER ist konservativer als FDR.
- FWER-Korrekturen (z. B. Bonferroni) sind strenger, während FDR-basierte Methoden (z. B. Benjamini-Hochberg) weniger konservativ sind.
📊 4. Vergleich zweier Therapieerfolge
Thema: Vergleich der Erfolgsraten einer neuen Therapie mit der Standardtherapie in einer klinischen Studie.
a) 2x2-Kreuztabelle
Erfolg | Kein Erfolg | Gesamt | |
---|---|---|---|
Neue Therapie | 35 | 15 | 50 |
Standardtherapie | 25 | 25 | 50 |
b) Hypothesentest
- Nullhypothese : Erfolgsraten sind gleich.
- Alternativhypothese : Erfolgsraten unterscheiden sich.
- Teststatistik (Chi-Quadrat-Test oder Z-Test):
mit:
- = beobachtete Erfolgsraten in beiden Gruppen,
- = gepoolte Erfolgsrate.
c) p-Wert-Berechnung mit R
- Vergleich des p-Werts mit , um zu prüfen, ob die Unterschiede signifikant sind.
📌 Fazit
✅ Confounding & logistische Regression: Adjustierte vs. unadjustierte Schätzungen vergleichen.
✅ Wald-Test zur Hypothesentestung in Regressionen.
✅ Ein-Stichproben-t-Test zur Untersuchung von Mittelwertsunterschieden.
✅ FWER vs. FDR: Multiples Testen und Fehlerkontrolle.
✅ Vergleich von Therapieerfolgen mit Kreuztabellen und statistischen Tests.