Aufgabe 1

Auf Moodle befindet sich ein Datensatz zur Messung des Zusammenhangs zwischen chronischer Bronchitis und Staubkonzentration (dust.RData). Hierbei handelt es sich um Daten, die in den Jahren 1960 bis 1977 an 1246 Mitarbeitern einer Münchner Fabrik erhoben wurden. Diese beinhalten die Angabe, ob der Mitarbeiter chronische Bronchitis hat (crb) und ob er raucht (smoking), sowie die Staubbelastung am Arbeitsplatz in mg/m³ (dust) und die Dauer der Belastung in Jahren (expo).

(a)

Lesen Sie den Datensatz dust.RData in R ein und verschaffen Sie sich einen Überblick über die Daten.

data <- get(load("./dust.RData"))
summary(data)
# View(data)

(b)

Verwenden Sie ein logistisches Regressionsmodell um den unadjustierten Zusammenhang zwischen Staubbelastung am Arbeitsplatz und chronischer Bronchitis zu schätzen. Stellen Sie dazu die Modellgleichung auf und passen Sie das Modell in R an. Quantifizieren Sie den Zusammenhang zwischen Staubbelastung am Arbeitsplatz und chronischer Bronchitis.

Mein log Regressionsmodell

Schema

\overset{y_{i}}{^}_{(krank)} = a + b_{1} \cdot x_{1}_{(dust)} + b_{2} \cdot x_{2}_{(smoking)} + b_{3} \cdot x_{3}_{(expo)}

Einsetzen in Logistisches Regressionsmodell

\hat{P} (y_{i} = 1)_{(krank)} = \frac{1}{1 + e ^{- (a + b_{1} \cdot x_{1_{(dust)}} + b_{2} \cdot x_{2_{(smoking)}} + b_{3} \cdot x_{3_{(expo)}})}}

Korrigierte Lösung

log_model <- glm(cbr ~ dust, data = data, family = binomial(link = 'logit'))
summary(log_model)

Nicht im Bezug zu cbr und dust

log_model <- glm(cbr ~ smoking + expo + dust, data = data, family = binomial)
summary(log_model)

$\downarrow$ Nicht im Bezug zu cbr und dust $\downarrow$

Call:
glm(formula = cbr ~ smoking + expo + dust, family = binomial,
    data = data)
 
Coefficients:
             Estimate Std. Error z.B.value Pr(>|z|)
(Intercept) -3.047872   0.248570 -12.262  < 2e-16 ***
smoking      0.676844   0.174380   3.881 0.000104 ***
expo         0.040155   0.006206   6.470 9.78e-11 ***
dust         0.091888   0.023243   3.953 7.71e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 
(Dispersion parameter for binomial family taken to be 1)
 
    Null deviance: 1356.8  on 1245  degrees of freedom
Residual deviance: 1278.3  on 1242  degrees of freedom
AIC: 1286.3
 
Number of Fisher Scoring iterations: 4

Werte einsetzen

log_modell

\hat{P} (y_{i} = 1)_{(krank)} = \frac{1}{1 + e ^{- (- 3.048 + 0.092 \cdot x_{1_{(dust)}} + 0.677 \cdot x_{2_{(smoking)}} + 0.040 \cdot x_{3_{(expo)}})}}

Zusammenhang zwischen `expo` und `cb`

Die Log-Odds aus dem logistischen Regressionmodell müssen $exp$ berechnet werden, um die normale Odds-Ratio wiedergeben zu können

O R_{i} = e^{b_{i}}

Dementsprechend:

O R_{dust} = e^{b_{3}_{(expo)}} = e^{0.091888} = 1.096242

exp(coef(log_model))

> print(exp(coef(log_model)))
(Intercept)     smoking        expo        dust
 0.04745981  1.96765828  1.04097185  1.09624166

Das bedeutet, dass eine Einheit Erhöhung der Staubbelastung die Odds für chronische Bronchitis um etwa 9.6% erhöht, wenn alle anderen Variablen konstant gehalten werden.

(c)

Gehen Sie nun wie in Aufgabe (b) vor um den für den Raucherstatus und die Belastungsdauer adjustierten Zusammenhang zwischen Staubbelastung am Arbeitsplatz und chronischer Bronchitis zu schätzen. Vermuten Sie, dass Confounding durch den Raucherstatus und/oder die Belastungsdauer vorliegt?

> print(exp(coef(log_model)))
(Intercept)     smoking        expo        dust
 0.04745981  1.96765828  1.04097185  1.09624166

Variable Intercept Smoking Expo Dust Koeffizient - 3.047872 0.676844 0.040155 0.091888 Odds Ratio (OR) e^{- 3.047872} \approx 0.047 e^{0.676844} \approx 1.968 e^{0.040155} \approx 1.041 e^{0.091888} \approx 1.096 Interpretation Baseline-Odds f \overset{u}{¨} r cbr = 1 bei allen Pr \overset{a}{¨} diktoren = 0 Erh \overset{o}{¨} ht die Odds um ca. 96.8% pro Einheit Erh \overset{o}{¨} ht die Odds um ca. 4.1% pro Einheit Erh \overset{o}{¨} ht die Odds um ca. 9.6% pro Einheit

Confounding durch Raucherstatus und Belastungsdauer ist plausibel, da beide Variablen mit der Staubbelastung und chronischer Bronchitis zusammenhängen und den beobachteten Zusammenhang verzerren könnten.

Test auf Confounding

> library(car)
> vif(log_model)
 smoking     expo     dust
1.003065 1.003377 1.001518

Mit VIF kann man Multikollinearität erkennen, die oft mit Confounding einhergeht. Allerdings schließt ein niedriger VIF-Wert Confounding nicht vollständig aus, da Confounding auch ohne hohe Multikollinearität auftreten kann. In unserem Fall zeigen die niedrigen VIF-Werte, dass Multikollinearität kein Problem ist, aber Confounding muss weiterhin durch inhaltliche Analysen oder Vergleiche zwischen adjustierten und unadjustierten Modellen geprüft werden.

(d)

Verwenden Sie den Wald Test um zu testen, ob es einen Zusammenhang zwischen der Staubbelastung und chronischer Bronchitis gibt (verwenden Sie hierbei den Schätzer und die Standardabweichung aus dem Modell in Aufgabe (c)). Geben Sie dazu die Null- und Alternativhypothese, die Teststatistik mit Prüfverteilung, den Prüfwert, den kritischen Wert der Prüfverteilung (bzw. den Ablehnungsbereich) und die Testentscheidung an.

Mitschrift aus Übung:

W = (\hat{β} - β_{0})^{T} Σ^{- 1} (\hat{β} - β_{0})

W = (Vektor der gesch \overset{a}{¨} tzten Parameter \hat{β} - Vektor der hypothetischen Werte unter der Nullhypothese β_{0})^{T} Inverse der Varianz-Kovarianz-Matrix der gesch \overset{a}{¨} tzten Parameter Σ^{- 1} (\hat{β} - β_{0})

library(aod)
wald.test(Sigma=vcov(log_model), b=coef(log_model), Term = 4)

W = [\hat{β}_{3} - β_{3} \hat{β}_{4} - β_{4}]^{T} Σ^{- 1} [\hat{β}_{3} - β_{3} \hat{β}_{4} - β_{4}] W = 15.6 bei df = 2

> wald.test(Sigma=vcov(log_model), b=coef(log_model), Term = 4)
Wald test:
----------
 
Chi-squared test:
X2 = 15.6, df = 1, P(> X2) = 7.7e-05

(p-value < 0.05) \to H_{0} ablehnen

Nullhypothese: Alternativhypothese: Teststatistik: Pr \overset{u}{¨} fverteilung: Kritischer Wert: Ergebnis: Schlussfolgerung: H_{0} : b_{dust} = 0 H_{1} : b_{dust} \neq = 0 T = \frac{β ^ _{d} - 0}{s e ^ ( β _{d} ^ )} (X^{2} = 15.6) χ^{2} -Verteilung mit df = 1 χ_{0.05, df = 1}^{2} = 3.84 Da X^{2} = 15.6 > 3.84 und P < 0.05, lehnen wir H_{0} ab. Es gibt einen signifikanten Zusammenhang zwischen der Staubbelastung und der betrachteten Antwortvariable.

(e)

Wenden Sie den Befehl summary() auf das Modell aus (c) an, um folgende Fragen zu beantworten:

> summary(log_model)
 
Call:
glm(formula = cbr ~ smoking + expo + dust, family = binomial,
    data = data)
 
Coefficients:
             Estimate Std. Error z.B.value Pr(>|z|)
(Intercept) -3.047872   0.248570 -12.262  < 2e-16 ***
smoking      0.676844   0.174380   3.881 0.000104 ***
expo         0.040155   0.006206   6.470 9.78e-11 ***
dust         0.091888   0.023243   3.953 7.71e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
 
(Dispersion parameter for binomial family taken to be 1)
 
    Null deviance: 1356.8  on 1245  degrees of freedom
Residual deviance: 1278.3  on 1242  degrees of freedom
AIC: 1286.3
 
Number of Fisher Scoring iterations: 4

(i) Wie ist die Interpretation der Regressionskoeffizienten von Raucherstatus und Belastungsdauer?

Raucherstatus
- Für eine Person, die Raucher ist, erhöhen sich die Log-Odds für chronische Bronchitis im Vergleich zu einer Nichtraucherperson um $0.676844$ , wenn alle anderen Variablen konstant gehalten werden.
- Umgerechnet bedeutet das, dass die Odds für chronische Bronchitis um $e^{0.676844} = 1.968 \approx 96.8%$ steigen.
Belastungsdauer
- Mit jeder zusätzlichen Einheit der Belastungsdauer steigen die Log-Odds für chronische Bronchitis um $0.040155$ , wenn alle anderen Variablen konstant gehalten werden.
- Umgerechnet bedeutet das, dass die Odds für chronische Bronchitis um $e^{0.040155} = 1.041 \approx 4.1%$ steigen.

Hinweis

Es handelt sich hierbei um eine Steigerung der Odds, nicht direkt der Wahrscheinlichkeit.
Die Odds drücken das Verhältnis von “Erfolg” zu “Misserfolg” aus, z. B. die Quote, dass eine Person chronische Bronchitis hat.
Die Wahrscheinlichkeit ( $P$ ) wird hingegen durch die Formel:
$P = \frac{Odds}{1 + Odds}$
berechnet. Daher ist der Zusammenhang zwischen Odds und Wahrscheinlichkeit nicht linear.
Bei sehr hohen oder sehr niedrigen Wahrscheinlichkeiten fällt der Effekt auf $P$ geringer aus als bei mittleren Wahrscheinlichkeiten.

(ii) Sind die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis bzw. zwischen Belastungsdauer und chronischer Bronchitis signifikant?

Ja, angedeutet durch *** am ende der Zeile

Coefficients:
             Estimate Std. Error z.B.value Pr(>|z|)
(Intercept) -3.047872   0.248570 -12.262  < 2e-16 ***
smoking      0.676844   0.174380   3.881 0.000104 ***
expo         0.040155   0.006206   6.470 9.78e-11 ***
dust         0.091888   0.023243   3.953 7.71e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(ii) Sind die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis bzw. zwischen Belastungsdauer und chronischer Bronchitis signifikant?

Ja, angedeutet durch *** am ende der Zeile

Coefficients:
             Estimate Std. Error z.B.value Pr(>|z|)
(Intercept) -3.047872   0.248570 -12.262  < 2e-16 ***
smoking      0.676844   0.174380   3.881 0.000104 ***
expo         0.040155   0.006206   6.470 9.78e-11 ***
dust         0.091888   0.023243   3.953 7.71e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Ausführlichere Antwort

Ja, die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis sowie zwischen Belastungsdauer und chronischer Bronchitis sind signifikant.

Dies wird durch die p-Werte und die Signifikanzmarkierungen (***) in der Modellzusammenfassung angezeigt:

Raucherstatus (smoking): Der p-Wert beträgt $P = 0.000104$ , was kleiner als das Signifikanzniveau von $0.05$ ist. Somit ist der Zusammenhang signifikant.

Belastungsdauer (expo): Der p-Wert beträgt $P = 9.78 \times 1 0^{- 11}$ , was ebenfalls viel kleiner als $0.05$ ist. Auch dieser Zusammenhang ist hochsignifikant.

Die Markierung *** weist darauf hin, dass die p-Werte kleiner als $0.001$ sind, was eine sehr starke Evidenz gegen die Nullhypothese ( $H_{0} : b = 0$ ) liefert.

Zusammenfassung: Beide Variablen haben einen signifikanten Zusammenhang mit chronischer Bronchitis.

Aufgabe 2

Ein Arzt erhält bei einer Beobachtungsstudie mit 20 Babys von Risiko-Patientinnen für das Geburtsgewicht einen Mittelwert von 3280 Gramm und eine Standardabweichung von 490 Gramm. Es wird angenommen, dass die Verteilung des Geburtsgewichts annähernd einer Normalverteilung entspricht. Kann nachgewiesen werden, ob sich das Gewicht für Babys von Risiko-Patientinnen von dem aus der Literatur bekannten Durchschnittswert von 3500 Gramm unterscheidet?

(a) Formulieren Sie das statistische Modell und die Null- und Alternativhypothese.

Das Geburtsgewicht $X$ wird als normalverteilt angenommen:

Förmlich

X \sim N (μ, σ^{2})

H_{0} H_{A} = Es kann \underline{nicht} nachgewiesen werden = Es \underline{kann} nachgewiesen werden

Werte einsetzen

X \sim N (3280, 490)

H_{0} H_{A} : μ = 3500 g : μ \neq = 3500 g

(b)Berechnen Sie die Prüfgröße.

In dieser Situation eignet sich ein zweiseitiger t-Test gut, da die Stichprobe klein ist (n = 20) und die Standardabweichung der Grundgesamtheit o nicht bekannt ist. Stattdessen wird die Stichprobenstandardabweichung s = 490 verwendet. Hier ist die Vorgehensweise:

t = \frac{x - μ _{0}}{\frac{s}{n}}

Einsetzen

t = \frac{3280 g - 3500 g}{\frac{490}{20}} = (- 2.01)

Kritischen Wert besitmmen

df = n - 1 = 19

Für ein Signifikanzniveau von $0, 05$ und einen zweiseitigen Test beträgt $t_{krit}$

t_{krit} \approx \pm 2, 093

Da, $- 2, 093 < 2, 01 < 2, 093$ kann $H_{0}$ nicht abgelehnt werden

(c) Formulieren und begründen Sie die Testentscheidung.

Testentscheidung

Da der berechnete t-Wert ( $- 2.01$ ) innerhalb des kritischen Bereichs ( $- 2.093 \leq t \leq 2.093$ ) liegt, wird die Nullhypothese $H_{0}$ nicht abgelehnt.

Begründung

Beim Signifikanzniveau von $0.05$ liefert der t-Test kein statistisch signifikantes Ergebnis. Das bedeutet, dass die Abweichung des beobachteten Mittelwerts ( $3280 g$ ) vom bekannten Durchschnittswert ( $3500 g$ ) nicht groß genug ist, um mit hinreichender Sicherheit auf eine tatsächliche Differenz in der Grundgesamtheit zu schließen. Es gibt also keinen ausreichenden Beleg dafür, dass sich das Geburtsgewicht von Babys von Risiko-Patientinnen signifikant vom Literaturwert unterscheidet.

(d) Interpretation der Testentscheidung

Da $H_{0}$ nicht abgelehnt wird, gibt es keinen statistischen Nachweis dafür, dass sich das Geburtsgewicht von Babys von Risiko-Patientinnen signifikant vom Literaturwert unterscheidet. Die Daten reichen nicht aus, um die Alternativhypothese $H_{A}$ zu bestätigen.

Aufgabe 3

In dieser Aufgabe werden die Family-wise Error Rate (FWER) und die False Discovery Rate (FDR) gegenübergestellt.

Vergleich von FWER und FDR

Family-wise Error Rate (FWER):

Die Family-wise Error Rate (FWER) bezeichnet die Wahrscheinlichkeit, bei einer Gruppe von Tests mindestens einen Fehler vom Typ I (falsch positiv) zu begehen:
$FWER = P (mindestens ein Fehler)$
Beispiel: Führt man 20 Tests mit einem Signifikanzniveau von $α = 0.05$ durch, ohne eine Anpassung vorzunehmen, liegt die Wahrscheinlichkeit, mindestens einen Fehler zu machen, über 5%.

False Discovery Rate (FDR):

Die False Discovery Rate (FDR) ist der erwartete Anteil der falsch positiven Ergebnisse unter allen als positiv identifizierten Entdeckungen:
$FDR = E [\frac{falsche Entdeckungen}{alle Entdeckungen}]$
Beispiel: Bei 100 durchgeführten Tests und 10 als positiv identifizierten Ergebnissen könnte eine FDR von 0,2 bedeuten, dass ungefähr 2 dieser positiven Ergebnisse falsch sind.

Zusammenfassung:

FWER bietet einen starken Schutz davor, überhaupt einen Fehler zu begehen. Dies ist besonders wichtig in Bereichen, wo Fehler schwerwiegende Folgen haben können, wie beispielsweise in klinischen Studien.

FDR ermöglicht mehr Entdeckungen, akzeptiert jedoch eine gewisse Anzahl von Fehlern. Dies ist besonders nützlich bei einer großen Anzahl von Tests, wie sie beispielsweise in der Genomforschung vorkommen.

(a) Zeigen Sie für den Spezialfall von $k = 1$ Test, dass $FDR = FWER$ .

FWER FDR = P (K_{0 +} > 0) = P (K_{0 +} = 1) = I E [\frac{K _{0}}{K _{+}} 1_{K}_{+ > 0}] = I E [K_{0}_{+} 1_{K}_{+ = 1}]

Betrachten wir den Fall mit nur einem Test ( $k = 1$ ):

FDR ist definiert als:
$FDR = P (V = 1)$
(Da bei $R = 1$ auch $V = 1$ gilt und bei $R = 0$ die FDR gleich 0 ist.)
FWER ist definiert als:
$FWER = P (V > 0)$
In diesem Szenario, wo $V$ entweder 0 oder 1 sein kann, ist dies ebenfalls $P (V = 1)$ .

Daraus folgt:

FDR = FWER

(b) Zeigen Sie, dass allgemein gilt, dass $FDR \leq FWER$ . Die Kontrolle welcher der beiden Größen führt somit zu „konservativeren“ Testentscheidungen? Begründen Sie kurz.

Nachweis, dass $FDR \leq FWER$

Die False Discovery Rate (FDR) wird definiert als:

FDR = E [\frac{V}{R} \cdot 1_{R > 0}]

Dabei gilt:

$\frac{V}{R} \leq 1$ für $R > 0$
$\frac{V}{R} = 0$ für $R = 0$

Daher ist:

FDR \leq P (V > 0)

Da die Family-wise Error Rate (FWER) definiert ist als:

FWER = P (V > 0)

ergibt sich:

FDR \leq FWER

Konservativere Entscheidungen

Die Kontrolle der FWER führt zu konservativeren Testentscheidungen, da sie darauf abzielt, die Wahrscheinlichkeit, überhaupt einen Fehler zu begehen, niedrig zu halten. Dies bedeutet, dass die Tests restriktiver sind und weniger Fehler zulassen, was insbesondere in kritischen Anwendungen wie klinischen Studien von Vorteil ist.

Im Gegensatz dazu erlaubt die Kontrolle der FDR eine gewisse Anzahl von Fehlern unter den abgelehnten Hypothesen, was mehr Flexibilität und eine höhere Entdeckungsrate ermöglicht. Daher sind Testentscheidungen, die auf der Kontrolle der FDR basieren, weniger konservativ im Vergleich zur FWER-Kontrolle.

Aufgabe 4

In einer klinischen Studie erhalten jeweils 50 Patienten eine neue Therapie bzw. die Standardtherapie. Die Therapien sind in 35 Fällen (neue Therapie) und 25 Fällen (Standard-Therapie) erfolgreich.

(a) Stellen Sie die entsprechende $2 \times 2$ -Kreuztabelle auf.

	Erfolg	Misserfolg	Gesamt
Neue Therapie	35	15	50
Standard-Therapie	25	25	50
Gesamt	60	40	100

(b) Führen Sie einen geeigneten Test durch, um auf einem 5%-Niveau zu prüfen, ob sich die Erfolgsraten der beiden Therapien unterscheiden.

Wir verwenden den Chi-Quadrat-Test für Unabhängigkeit.

Schritte:

Hypothesen:
- $H_{0}$ : Die Erfolgsraten sind gleich ( $p_{neu} = p_{standard}$ ).
- $H_{A}$ : Die Erfolgsraten unterscheiden sich ( $p_{neu} \neq = p_{standard}$ ).
Erwartete Häufigkeiten:
$E_{ij} = \frac{Zeilensumme \times Spaltensumme}{Gesamtsumme}$
- $E_{neu, Erfolg} = \frac{50 \times 60}{100} = 30$
- $E_{neu, Misserfolg} = \frac{50 \times 40}{100} = 20$
- $E_{standard, Erfolg} = \frac{50 \times 60}{100} = 30$
- $E_{standard, Misserfolg} = \frac{50 \times 40}{100} = 20$
Chi-Quadrat-Statistik:
$χ^{2} = \sum \frac{( O _{ij} - E _{ij} ) ^{2}}{E _{ij}} = \frac{( 35 - 30 ) ^{2}}{30} + \frac{( 15 - 20 ) ^{2}}{20} + \frac{( 25 - 30 ) ^{2}}{30} + \frac{( 25 - 20 ) ^{2}}{20} = \frac{25}{30} + \frac{25}{20} + \frac{25}{30} + \frac{25}{20} = 0.833 + 1.25 + 0.833 + 1.25 = 4.166$
Vergleich mit dem kritischen Wert:
- Freiheitsgrade: $(2 - 1) (2 - 1) = 1$
- Kritischer Wert bei $α = 0.05$ : $χ_{1, 0.95}^{2} \approx 3.84$
- Da $4.166 > 3.84$ , wird $H_{0}$ abgelehnt.

Ergebnis: Es gibt einen signifikanten Unterschied in den Erfolgsraten der beiden Therapien auf dem 5%-Niveau.

(c) Benutzen Sie in R, um den p-Wert für den Test aus (b) zu bestimmen. (optionale Teilaufgabe)

# Erstellung der Kontingenztabelle
matrix_data <- matrix(c(35, 15, 25, 25), nrow = 2, byrow = TRUE)
colnames(matrix_data) <- c("Erfolg", "Misserfolg")
rownames(matrix_data) <- c("Neue Therapie", "Standard-Therapie")
 
# Durchführung des Chi-Quadrat-Tests
test <- chisq.test(matrix_data)
 
# Ausgabe des p-Werts
test$p.value

Interpretation: Der ausgegebene p-Wert bestätigt, ob der Unterschied signifikant ist. Bei einem p-Wert < 0.05 wird die Nullhypothese abgelehnt.

🎓 MyUniNotes

Explorer

EiMedBiom - Blatt 4

Aufgabe 1

(a)

(b)

Mein log Regressionsmodell

Werte einsetzen

Zusammenhang zwischen `expo` und `cb`

(c)

Test auf Confounding

(d)

(e)

(i) Wie ist die Interpretation der Regressionskoeffizienten von Raucherstatus und Belastungsdauer?

(ii) Sind die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis bzw. zwischen Belastungsdauer und chronischer Bronchitis signifikant?

(ii) Sind die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis bzw. zwischen Belastungsdauer und chronischer Bronchitis signifikant?

Aufgabe 2

(a) Formulieren Sie das statistische Modell und die Null- und Alternativhypothese.

Förmlich

Werte einsetzen

(b)Berechnen Sie die Prüfgröße.

(c) Formulieren und begründen Sie die Testentscheidung.

Testentscheidung

Begründung

(d) Interpretation der Testentscheidung

Aufgabe 3

(a) Zeigen Sie für den Spezialfall von $k = 1$ Test, dass $FDR = FWER$ .

(b) Zeigen Sie, dass allgemein gilt, dass $FDR \leq FWER$ . Die Kontrolle welcher der beiden Größen führt somit zu „konservativeren“ Testentscheidungen? Begründen Sie kurz.

Nachweis, dass $FDR \leq FWER$

Konservativere Entscheidungen

Aufgabe 4

(a) Stellen Sie die entsprechende $2 \times 2$ -Kreuztabelle auf.

(b) Führen Sie einen geeigneten Test durch, um auf einem 5%-Niveau zu prüfen, ob sich die Erfolgsraten der beiden Therapien unterscheiden.

(c) Benutzen Sie in R, um den p-Wert für den Test aus (b) zu bestimmen. (optionale Teilaufgabe)

Graph View

Table of Contents

Backlinks

🎓 MyUniNotes

Explorer

EiMedBiom - Blatt 4

Aufgabe 1

(a)

(b)

Mein log Regressionsmodell

Werte einsetzen

Zusammenhang zwischen expo und cb

(c)

Test auf Confounding

(d)

(e)

(i) Wie ist die Interpretation der Regressionskoeffizienten von Raucherstatus und Belastungsdauer?

(ii) Sind die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis bzw. zwischen Belastungsdauer und chronischer Bronchitis signifikant?

(ii) Sind die Zusammenhänge zwischen Raucherstatus und chronischer Bronchitis bzw. zwischen Belastungsdauer und chronischer Bronchitis signifikant?

Aufgabe 2

(a) Formulieren Sie das statistische Modell und die Null- und Alternativhypothese.

Förmlich

Werte einsetzen

(b)Berechnen Sie die Prüfgröße.

(c) Formulieren und begründen Sie die Testentscheidung.

Testentscheidung

Begründung

(d) Interpretation der Testentscheidung

Aufgabe 3

(a) Zeigen Sie für den Spezialfall von k=1 Test, dass FDR=FWER.

(b) Zeigen Sie, dass allgemein gilt, dass FDR≤FWER. Die Kontrolle welcher der beiden Größen führt somit zu „konservativeren“ Testentscheidungen? Begründen Sie kurz.

Nachweis, dass FDR≤FWER

Konservativere Entscheidungen

Aufgabe 4

(a) Stellen Sie die entsprechende 2×2-Kreuztabelle auf.

(b) Führen Sie einen geeigneten Test durch, um auf einem 5%-Niveau zu prüfen, ob sich die Erfolgsraten der beiden Therapien unterscheiden.

(c) Benutzen Sie in R, um den p-Wert für den Test aus (b) zu bestimmen. (optionale Teilaufgabe)

Graph View

Table of Contents

Backlinks

Zusammenhang zwischen `expo` und `cb`

(a) Zeigen Sie für den Spezialfall von $k = 1$ Test, dass $FDR = FWER$ .

(b) Zeigen Sie, dass allgemein gilt, dass $FDR \leq FWER$ . Die Kontrolle welcher der beiden Größen führt somit zu „konservativeren“ Testentscheidungen? Begründen Sie kurz.

Nachweis, dass $FDR \leq FWER$

(a) Stellen Sie die entsprechende $2 \times 2$ -Kreuztabelle auf.