Aufgabe 1
Auf Moodle befindet sich ein Datensatz zur Messung des Zusammenhangs zwischen chronischer Bronchitis und Staubkonzentration (
dust.RData
). Hierbei handelt es sich um Daten, die in den Jahren 1960 bis 1977 an 1246 Mitarbeitern einer Münchner Fabrik erhoben wurden. Diese beinhalten die Angabe, ob der Mitarbeiter chronische Bronchitis hat (crb
) und ob er raucht (smoking
), sowie die Staubbelastung am Arbeitsplatz in mg/m³ (dust
) und die Dauer der Belastung in Jahren (expo
).
(a)
Lesen Sie den Datensatz
dust.RData
in R ein und verschaffen Sie sich einen Überblick über die Daten.
(b)
Verwenden Sie ein logistisches Regressionsmodell um den unadjustierten Zusammenhang zwischen Staubbelastung am Arbeitsplatz und chronischer Bronchitis zu schätzen. Stellen Sie dazu die Modellgleichung auf und passen Sie das Modell in R an. Quantifizieren Sie den Zusammenhang zwischen Staubbelastung am Arbeitsplatz und chronischer Bronchitis.
Mein log Regressionsmodell
Schema
Einsetzen in Logistisches Regressionsmodell
Korrigierte Lösung
Nicht im Bezug zu cbr und dust
\downarrow
Nicht im Bezug zu cbr und dust\downarrow
Werte einsetzen
log_modell
Zusammenhang zwischen expo
und cb
Die Log-Odds aus dem logistischen Regressionmodell müssen berechnet werden, um die normale Odds-Ratio wiedergeben zu können
Dementsprechend:
Das bedeutet, dass eine Einheit Erhöhung der Staubbelastung die Odds für chronische Bronchitis um etwa 9.6% erhöht, wenn alle anderen Variablen konstant gehalten werden.
(c)
Gehen Sie nun wie in Aufgabe (b) vor um den für den Raucherstatus und die Belastungsdauer adjustierten Zusammenhang zwischen Staubbelastung am Arbeitsplatz und chronischer Bronchitis zu schätzen. Vermuten Sie, dass Confounding durch den Raucherstatus und/oder die Belastungsdauer vorliegt?
Confounding durch Raucherstatus und Belastungsdauer ist plausibel, da beide Variablen mit der Staubbelastung und chronischer Bronchitis zusammenhängen und den beobachteten Zusammenhang verzerren könnten.
Test auf Confounding
Mit VIF
kann man Multikollinearität erkennen, die oft mit Confounding einhergeht. Allerdings schließt ein niedriger VIF-Wert Confounding nicht vollständig aus, da Confounding auch ohne hohe Multikollinearität auftreten kann. In unserem Fall zeigen die niedrigen VIF-Werte, dass Multikollinearität kein Problem ist, aber Confounding muss weiterhin durch inhaltliche Analysen oder Vergleiche zwischen adjustierten und unadjustierten Modellen geprüft werden.
(d)
Verwenden Sie den Wald Test um zu testen, ob es einen Zusammenhang zwischen der Staubbelastung und chronischer Bronchitis gibt (verwenden Sie hierbei den Schätzer und die Standardabweichung aus dem Modell in Aufgabe (c)). Geben Sie dazu die Null- und Alternativhypothese, die Teststatistik mit Prüfverteilung, den Prüfwert, den kritischen Wert der Prüfverteilung (bzw. den Ablehnungsbereich) und die Testentscheidung an.
Mitschrift aus Übung:
(e)
Wenden Sie den Befehl summary()
auf das Modell aus (c) an, um folgende Fragen zu beantworten:
(i) Wie ist die Interpretation der Regressionskoeffizienten von Raucherstatus und Belastungsdauer?
-
Raucherstatus
- Für eine Person, die Raucher ist, erhöhen sich die Log-Odds für chronische Bronchitis im Vergleich zu einer Nichtraucherperson um , wenn alle anderen Variablen konstant gehalten werden.
- Umgerechnet bedeutet das, dass die Odds für chronische Bronchitis um steigen.
-
Belastungsdauer
- Mit jeder zusätzlichen Einheit der Belastungsdauer steigen die Log-Odds für chronische Bronchitis um , wenn alle anderen Variablen konstant gehalten werden.
- Umgerechnet bedeutet das, dass die Odds für chronische Bronchitis um steigen.
Hinweis
Es handelt sich hierbei um eine Steigerung der Odds, nicht direkt der Wahrscheinlichkeit.
Die Odds drücken das Verhältnis von “Erfolg” zu “Misserfolg” aus, z. B. die Quote, dass eine Person chronische Bronchitis hat.
Die Wahrscheinlichkeit () wird hingegen durch die Formel:berechnet. Daher ist der Zusammenhang zwischen Odds und Wahrscheinlichkeit nicht linear.
Bei sehr hohen oder sehr niedrigen Wahrscheinlichkeiten fällt der Effekt auf geringer aus als bei mittleren Wahrscheinlichkeiten.
(ii) Sind die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis bzw. zwischen Belastungsdauer und chronischer Bronchitis signifikant?
- Ja, angedeutet durch
***
am ende der Zeile
(ii) Sind die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis bzw. zwischen Belastungsdauer und chronischer Bronchitis signifikant?
- Ja, angedeutet durch
***
am ende der Zeile
Ausführlichere Antwort
Ja, die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis sowie zwischen Belastungsdauer und chronischer Bronchitis sind signifikant.
- Dies wird durch die p-Werte und die Signifikanzmarkierungen (
***
) in der Modellzusammenfassung angezeigt:
- Raucherstatus (
smoking
): Der p-Wert beträgt , was kleiner als das Signifikanzniveau von ist. Somit ist der Zusammenhang signifikant.- Belastungsdauer (
expo
): Der p-Wert beträgt , was ebenfalls viel kleiner als ist. Auch dieser Zusammenhang ist hochsignifikant.- Die Markierung
***
weist darauf hin, dass die p-Werte kleiner als sind, was eine sehr starke Evidenz gegen die Nullhypothese () liefert.- Zusammenfassung: Beide Variablen haben einen signifikanten Zusammenhang mit chronischer Bronchitis.
Aufgabe 2
Ein Arzt erhält bei einer Beobachtungsstudie mit 20 Babys von Risiko-Patientinnen für das Geburtsgewicht einen Mittelwert von 3280 Gramm und eine Standardabweichung von 490 Gramm. Es wird angenommen, dass die Verteilung des Geburtsgewichts annähernd einer Normalverteilung entspricht. Kann nachgewiesen werden, ob sich das Gewicht für Babys von Risiko-Patientinnen von dem aus der Literatur bekannten Durchschnittswert von 3500 Gramm unterscheidet?
(a) Formulieren Sie das statistische Modell und die Null- und Alternativhypothese.
Das Geburtsgewicht wird als normalverteilt angenommen:
Förmlich
Werte einsetzen
(b)Berechnen Sie die Prüfgröße.
In dieser Situation eignet sich ein zweiseitiger t-Test gut, da die Stichprobe klein ist (n = 20) und die Standardabweichung der Grundgesamtheit o nicht bekannt ist. Stattdessen wird die Stichprobenstandardabweichung s = 490 verwendet. Hier ist die Vorgehensweise:
Einsetzen
Kritischen Wert besitmmen
Für ein Signifikanzniveau von und einen zweiseitigen Test beträgt
Da, kann nicht abgelehnt werden
(c) Formulieren und begründen Sie die Testentscheidung.
Testentscheidung
Da der berechnete t-Wert () innerhalb des kritischen Bereichs () liegt, wird die Nullhypothese nicht abgelehnt.
Begründung
Beim Signifikanzniveau von liefert der t-Test kein statistisch signifikantes Ergebnis. Das bedeutet, dass die Abweichung des beobachteten Mittelwerts () vom bekannten Durchschnittswert () nicht groß genug ist, um mit hinreichender Sicherheit auf eine tatsächliche Differenz in der Grundgesamtheit zu schließen. Es gibt also keinen ausreichenden Beleg dafür, dass sich das Geburtsgewicht von Babys von Risiko-Patientinnen signifikant vom Literaturwert unterscheidet.
(d) Interpretation der Testentscheidung
Da nicht abgelehnt wird, gibt es keinen statistischen Nachweis dafür, dass sich das Geburtsgewicht von Babys von Risiko-Patientinnen signifikant vom Literaturwert unterscheidet. Die Daten reichen nicht aus, um die Alternativhypothese zu bestätigen.
Aufgabe 3
In dieser Aufgabe werden die Family-wise Error Rate (FWER) und die False Discovery Rate (FDR) gegenübergestellt.
Vergleich von FWER und FDR
Family-wise Error Rate (FWER):
Die Family-wise Error Rate (FWER) bezeichnet die Wahrscheinlichkeit, bei einer Gruppe von Tests mindestens einen Fehler vom Typ I (falsch positiv) zu begehen:
Beispiel: Führt man 20 Tests mit einem Signifikanzniveau von durch, ohne eine Anpassung vorzunehmen, liegt die Wahrscheinlichkeit, mindestens einen Fehler zu machen, über 5%.
False Discovery Rate (FDR):
Die False Discovery Rate (FDR) ist der erwartete Anteil der falsch positiven Ergebnisse unter allen als positiv identifizierten Entdeckungen:
Beispiel: Bei 100 durchgeführten Tests und 10 als positiv identifizierten Ergebnissen könnte eine FDR von 0,2 bedeuten, dass ungefähr 2 dieser positiven Ergebnisse falsch sind.
Zusammenfassung:
- FWER bietet einen starken Schutz davor, überhaupt einen Fehler zu begehen. Dies ist besonders wichtig in Bereichen, wo Fehler schwerwiegende Folgen haben können, wie beispielsweise in klinischen Studien.
- FDR ermöglicht mehr Entdeckungen, akzeptiert jedoch eine gewisse Anzahl von Fehlern. Dies ist besonders nützlich bei einer großen Anzahl von Tests, wie sie beispielsweise in der Genomforschung vorkommen.
(a) Zeigen Sie für den Spezialfall von Test, dass .
Betrachten wir den Fall mit nur einem Test ():
-
FDR ist definiert als:
(Da bei auch gilt und bei die FDR gleich 0 ist.)
-
FWER ist definiert als:
In diesem Szenario, wo entweder 0 oder 1 sein kann, ist dies ebenfalls .
Daraus folgt:
(b) Zeigen Sie, dass allgemein gilt, dass . Die Kontrolle welcher der beiden Größen führt somit zu „konservativeren“ Testentscheidungen? Begründen Sie kurz.
Nachweis, dass
Die False Discovery Rate (FDR) wird definiert als:
Dabei gilt:
- für
- für
Daher ist:
Da die Family-wise Error Rate (FWER) definiert ist als:
ergibt sich:
Konservativere Entscheidungen
Die Kontrolle der FWER führt zu konservativeren Testentscheidungen, da sie darauf abzielt, die Wahrscheinlichkeit, überhaupt einen Fehler zu begehen, niedrig zu halten. Dies bedeutet, dass die Tests restriktiver sind und weniger Fehler zulassen, was insbesondere in kritischen Anwendungen wie klinischen Studien von Vorteil ist.
Im Gegensatz dazu erlaubt die Kontrolle der FDR eine gewisse Anzahl von Fehlern unter den abgelehnten Hypothesen, was mehr Flexibilität und eine höhere Entdeckungsrate ermöglicht. Daher sind Testentscheidungen, die auf der Kontrolle der FDR basieren, weniger konservativ im Vergleich zur FWER-Kontrolle.
Aufgabe 4
In einer klinischen Studie erhalten jeweils 50 Patienten eine neue Therapie bzw. die Standardtherapie. Die Therapien sind in 35 Fällen (neue Therapie) und 25 Fällen (Standard-Therapie) erfolgreich.
(a) Stellen Sie die entsprechende -Kreuztabelle auf.
Erfolg | Misserfolg | Gesamt | |
---|---|---|---|
Neue Therapie | 35 | 15 | 50 |
Standard-Therapie | 25 | 25 | 50 |
Gesamt | 60 | 40 | 100 |
(b) Führen Sie einen geeigneten Test durch, um auf einem 5%-Niveau zu prüfen, ob sich die Erfolgsraten der beiden Therapien unterscheiden.
Wir verwenden den Chi-Quadrat-Test für Unabhängigkeit.
Schritte:
-
Hypothesen:
- : Die Erfolgsraten sind gleich ().
- : Die Erfolgsraten unterscheiden sich ().
-
Erwartete Häufigkeiten:
-
Chi-Quadrat-Statistik:
-
Vergleich mit dem kritischen Wert:
- Freiheitsgrade:
- Kritischer Wert bei :
- Da , wird abgelehnt.
Ergebnis: Es gibt einen signifikanten Unterschied in den Erfolgsraten der beiden Therapien auf dem 5%-Niveau.
(c) Benutzen Sie in R, um den p-Wert für den Test aus (b) zu bestimmen. (optionale Teilaufgabe)
Interpretation: Der ausgegebene p-Wert bestätigt, ob der Unterschied signifikant ist. Bei einem p-Wert < 0.05 wird die Nullhypothese abgelehnt.