📌 Übungsblatt 3 – Cheat Sheet

Hier die Lösung zum Blatt: EiMedBiom - Blatt 3


📊 1. Diagnostische Tests: Sensitivität, Spezifizität & Prädiktive Werte

a) Kontingenztafel für HIV-Test

  • Diagnostische Tests werden mit einer Vierfeldertafel analysiert:
HIV-positiv ()HIV-negativ ()Summe
Test positiv () (True Positive) (False Positive)
Test negativ () (False Negative) (True Negative)
Summe
  • Sensitivität (): Wahrscheinlichkeit, dass ein Kranker positiv getestet wird.
  • Spezifizität (): Wahrscheinlichkeit, dass ein Gesunder negativ getestet wird.

b) Prädiktive Werte

  • Positiver prädiktiver Wert (PPV): Wahrscheinlichkeit, dass jemand mit positivem Test wirklich krank ist.

  • Negativer prädiktiver Wert (NPV): Wahrscheinlichkeit, dass jemand mit negativem Test wirklich gesund ist.

  • Warum ist der PPV stark von der Prävalenz abhängig?

    • Je niedriger die Prävalenz, desto mehr falsch-positive Ergebnisse → PPV sinkt.
    • Bei seltenen Krankheiten kann der PPV trotz hoher Sensitivität und Spezifität niedrig sein.

📉 2. Odds Ratio & Mantel-Haenszel-Schätzer

  • Untersuchung des Zusammenhangs zwischen Rauchen und 20-Jahres-Überleben.

  • Vierfeldertafel für jede Altersgruppe:

    Überlebt ()Verstorben ()
    Raucher ()
    Nichtraucher ()

a) Unadjustiertes Odds Ratio (OR)

  • Beschreibt die Chancen eines Ereignisses in einer Gruppe im Vergleich zur anderen:

  • Interpretation:

    • → Rauchen ist mit einer höheren Sterbewahrscheinlichkeit assoziiert.
    • → Rauchen ist mit einer geringeren Sterbewahrscheinlichkeit assoziiert (unwahrscheinlich).

b) Mantel-Haenszel-Schätzer

  • Berechnet ein adjustiertes Odds Ratio über mehrere Strata (Altersgruppen):

  • Warum ist das wichtig?

    • Das unadjustierte OR könnte verzerrt sein, wenn Altersgruppen als Confounder nicht berücksichtigt werden.
    • Der Mantel-Haenszel-Schätzer korrigiert für Altersunterschiede.

📊 3. Multiple Regression & Interaktionseffekte

  • Erstellung einer linearen Regressionsfunktion:

a) Variablenarten

  • : Gleichverteilte kontinuierliche Variable ().
  • : Binomialverteilte Dummy-Variable ().

b) Naives vs. vollständiges Modell

  • Naives Modell: Enthält nur , ignoriert und deren Wechselwirkung.
  • Vollständiges Modell: Enthält und die Interaktion .

c) Interpretation der Interaktion

  • Warum ist wichtig?
    • könnte ein Confounder sein.
    • Falls signifikant ist, bedeutet das, dass die Wirkung von von abhängt.

d) Visualisierung

  • Regressionsgeraden für unterschiedliche Werte von :
    • → Effekt von alleine.
    • → Effekt von + Interaktionseffekt.
    • Falls Interaktion signifikant, haben die Geraden unterschiedliche Steigungen.

📊 4. Simulationsstudie mit Mehrdimensionaler Normalverteilung

  • Ziel: Generierung synthetischer Daten für eine Regressionsanalyse.

  • Multivariate Normalverteilung:

  • Code-Snippet für R:

    library(mvtnorm)
    set.seed(123)
    n <- 300
     
    mu1 <- c(1,1)
    mu2 <- c(7,3)
    sigma1 <- matrix(c(1,-,-,1), ncol = 2)
    sigma2 <- matrix(c(1.5,-,-,1), ncol = 2)
     
    x1 <- rmvnorm(n, mu1, sigma1)
    x2 <- rmvnorm(n, mu2, sigma2)
     
    data <- data.frame(rbind(x1,x2))
    data$cat <- rep(c(T, F), each = n)
    names(data) <- c("y", "x1", "x2")
  • Was passiert hier?

    • Erstellung von korrelierten Daten mit unterschiedlichen Mittelwerten und Kovarianzmatrizen.
    • Variable beeinflusst die Struktur der Daten.

📌 Fazit

Diagnostische Tests: Sensitivität, Spezifizität, prädiktive Werte berechnen & interpretieren.
Odds Ratio und Mantel-Haenszel-Schätzer: Vergleich von adjustierten und unadjustierten Effekten.
Multiple Regression & Interaktionseffekte: Wie beeinflusst eine Variable den Effekt einer anderen?
Simulation von Daten in R: Mehrdimensionale Normalverteilung & deren Einfluss auf die Analyse.