Verständnis des Posteriori-Erwartungswertes

In der Bayesstatistik ist der Posteriori-Erwartungswert eine zentrale Größe, die es ermöglicht, aus einer Kombination von Vorwissen (Priori-Verteilung) und neuen Daten (Likelihood) eine durchschnittliche Schätzung über eine Zufallsvariable zu gewinnen. Dieser Guide erklärt, wie man den Posteriori-Erwartungswert für stetige und diskrete Gleichverteilungen berechnet und interpretiert.

Grundlagen

Zuerst sollten wir einige Grundbegriffe klären:

  • Priori-Verteilung: Dein anfängliches Wissen oder Annahmen über eine Zufallsvariable, bevor du neue Daten betrachtest.
  • Likelihood: Eine Funktion, die angibt, wie wahrscheinlich es ist, die beobachteten Daten unter verschiedenen möglichen Werten der Zufallsvariable zu erhalten.
  • Posteriori-Verteilung: Das Ergebnis der Kombination von Priori und Likelihood, reflektiert dein aktualisiertes Wissen nach der Betrachtung neuer Daten.

Posteriori-Erwartungswert bei stetigen Gleichverteilungen

Wenn deine Priori-Verteilung eine stetige Gleichverteilung ist (z.B. ), dann ist deine Priori eine Verteilung. Nach Beobachtung von Daten wird die Posteriori-Verteilung auch eine Beta-Verteilung sein, allerdings mit aktualisierten Parametern.

Beispiel

Angenommen, du hast eine Münze geworfen und willst die Wahrscheinlichkeit eines Kopfes schätzen. Deine Priori-Verteilung ist , und du beobachtest 3 Köpfe und 7 Zahlwürfe in 10 Würfen. Deine Posteriori-Verteilung wäre .

Der Posteriori-Erwartungswert berechnet sich dann als:

Dieser Wert ist deine beste Schätzung der Kopfwahrscheinlichkeit nach dem Betrachten der Daten.

Posteriori-Erwartungswert bei diskreten Gleichverteilungen

Für diskrete Gleichverteilungen, wo nur spezifische Werte annehmen kann (z.B. auf einem Gitter wie ), ist der Prozess ähnlich, allerdings mit einer Summation über alle möglichen Werte.

Beispiel

Wenn die gleiche Münzwurfaufgabe wie oben auf einem Gitter annimmt, würdest du jede Gitterstelle evaluieren und die Posteriori-Wahrscheinlichkeiten berechnen:

Nach der Normalisierung dieser Wahrscheinlichkeiten erhältst du einen Posteriori-Erwartungswert durch Summierung:

Zusammenfassung

Der Posteriori-Erwartungswert ist eine robuste Methode zur Schätzung von Wahrscheinlichkeiten, die dein Vorwissen und neue Daten kombiniert. Er hilft dir, Entscheidungen auf der Grundlage des aktualisierten Wissens zu treffen und ist besonders nützlich in Unsicherheitssituationen. Ob in stetigen oder diskreten Settings, das Prinzip bleibt das gleiche: aktualisiere deine Überzeugungen auf Basis neuer Beweise.

Für weiterführende praktische Übungen und vertiefende Erklärungen empfehlen wir, Softwaretools wie R oder Python zu verwenden, um reale Datensätze zu analysieren und deine theoretischen Kenntnisse anzuwenden.

Example

Beispiel R:

Ein einfacher Weg, um den Umgang mit Posteriori-Erwartungswerten in R zu üben, ist die Verwendung eines simulierten Datensatzes für eine Binomialaufgabe. Nehmen wir an, du möchtest die Erfolgswahrscheinlichkeit eines Produkts auf der Basis von Verkaufsdaten schätzen.

Hier ist ein Beispiel für einen solchen Datensatz in R sowie der R-Code, der benötigt wird, um die Priori-Annahme zu überprüfen, die Daten zu aktualisieren und den Posteriori-Erwartungswert zu berechnen. In diesem Beispiel simulieren wir Verkaufsdaten, bei denen wir annehmen, dass 30 von 100 potenziellen Kunden das Produkt kaufen.

R-Code mit Kommentaren

# R-Paket laden, das für die Berechnungen benötigt wird
install.packages("ggplot2") # Für die Visualisierung
library(ggplot2)
 
# Daten simulieren
set.seed(123)  # Setzt den Zufallszahlengenerator, um reproduzierbare Ergebnisse zu erhalten
n <- 100       # Gesamtzahl der Versuche
x <- 30        # Anzahl der "Erfolge"
 
# Priori-Verteilung festlegen: Gleichverteilung als nicht-informative Priori
alpha_prior <- 1
beta_prior <- 1
 
# Posteriori-Parameter aktualisieren
alpha_post <- alpha_prior + x
beta_post <- beta_prior + (n - x)
 
# Posteriori-Erwartungswert berechnen
posterior_mean <- alpha_post / (alpha_post + beta_post)
posterior_mean  # Ausgabe des Posteriori-Erwartungswertes
 
# Posteriori-Verteilung visualisieren
x_values <- seq(0, 1, length.out = 100)
posterior_values <- dbeta(x_values, alpha_post, beta_post)
plot(x_values, posterior_values, type = 'l', lwd = 2, col = 'blue',
     main = "Posteriori-Verteilung",
     xlab = "Wahrscheinlichkeit des Erfolgs", ylab = "Dichte")

Was dieser Code macht:

  1. Pakete und Bibliotheken laden: Lädt ggplot2 für die Visualisierung. Dieses Paket ist sehr beliebt für statistische Grafiken in R.
  2. Daten Simulieren: Erzeugt einen Datensatz, der annimmt, dass von 100 Versuchen 30 erfolgreich sind.
  3. Priori festlegen: Startet mit einer Gleichverteilung (Beta(1,1)), die eine nicht-informative Priori-Verteilung darstellt.
  4. Posteriori-Parameter aktualisieren: Aktualisiert die Parameter der Beta-Verteilung basierend auf den beobachteten Daten.
  5. Posteriori-Erwartungswert berechnen: Berechnet den Erwartungswert der aktualisierten Beta-Verteilung.
  6. Visualisierung: Zeichnet die Posteriori-Dichtefunktion, die eine visuelle Darstellung der geschätzten Wahrscheinlichkeitsverteilung des Erfolgs gibt.

Dieser R-Code bietet eine einfache, praktische Anwendung der Bayesschen Statistik mit einem simulierten Beispiel, das die Theorie in einen realen Kontext setzt. Durch Anpassen der Daten oder der Priori-Verteilung können die Studierenden experimentieren und sehen, wie sich die Ergebnisse ändern.