[[BaySta-Blatt-1#Aufgabe 2#(e) Wie hoch ist die Wahrscheinlichkeit, dass eine Person bei der bei diesem Vorgehen der PCR-Test positiv ist, tatsächlich Corona-infiziert ist?|BaySta-1-2e nochmal machen]] [completion:: 2024-07-15]
Eine Schokoladenfabrik stellt Pralinen her, die jeweils eine Kirsche enthalten. Die benötigten Kirschen werden an zwei Maschinen entkernt. Maschine A liefert 70 % dieser Kirschen, wobei 8 % der von A gelieferten Kirschen den Kern noch enthalten. Maschine B produziert 30 % der benötigten Kirschen, wobei 5 % der von B gelieferten Kirschen den Kern noch enthalten. Bei einer abschließenden Gewichtskontrolle werden 95 % der Pralinen, in denen ein Kirschkern enthalten ist, aussortiert, aber auch 2 % der Pralinen ohne Kern.
(a) Modellieren Sie diesen mehrstufigen Vorgang geeignet. Wie groß ist die Wahrscheinlichkeit, dass eine Praline mit Kirschkern in den Verkauf gelangt?
Maschine A liefert 70% der Kirschen mit Fehlerquote von 8%
Maschine B liefert 30% der Kirsche mit Fehlerquote von 5%
Endkontrolle:
95% der Pralinen mit Kern werden korrekt aussortiert
2% der Pralinen ohne Kern werden fälschlicherweise aussortiert
Gefragt ist nach: Praline mit Kirschkern wird nicht aussortiert
P("Kirschkern landet im Verkauf")=(0.7⋅0.08+0.3⋅0.05)⋅0.05=0.00355≈0.36%
(b) Ein Kunde kauft eine Packung mit 100 Pralinen. Wie groß ist die Wahrscheinlichkeit, dass nur gute Pralinen, also Pralinen ohne Kirschkern, in der Packung sind?
Muss noch aussgebessert werden vergleiche ML
P("Kein Kirschkern landet im Verkauf")=1−P("Kirschkern landet im Verkauf")=1−(0.7⋅0.08+0.3⋅0.05)⋅0.05=1−0.00355=0.99645≈99.6%P("Nur gute Pralinen in 100 Packungen")=0.99645+0.003550.99645100
Aufgabe 2
Aufgabenstellung
Nehmen wir an, die Prävalenz von Corona an einem gewissen Tag liege bei 20 ansteckenden Personen bei 100.000 Einwohnern.
Die Spezifität (Wahrscheinlichkeit, dass der Test einer gesunden Person negativ ausfällt) eines Antigen-Tests liege bei 98%. Die Sensitivität (Wahrscheinlichkeit, dass der Test bei einer erkrankten Person positiv ausfällt) des Antigen-Tests liege bei 90%.
Die Spezifität eines PCR-Tests liege bei 99%. Die Sensitivität des PCR-Tests liege bei 98%.
Es sei folgendes Vorgehen üblich: Es wird erst ein Antigen-Test durchgeführt. Fällt er positiv aus, so wird ein PCR-Test ausgeführt.
(a) Formulieren Sie die hier dargestellten Ereignisse und Wahrscheinlichkeiten.
P(T)=Test positiv P(Krank)=P(K)=10000020=0.0002
Antigen-Test:
PAG(T∣Krank)=0.98
PAG(T∣Krank)=0.90
PCR-Test:
PPCR(T∣Krank)=0.99
PPCR(T∣Krank)=0.98
(b) Wie hoch ist die Wahrscheinlichkeit, dass eine Person, bei der auch der PCR-Test positiv ist, tatsächlich Corona-infiziert ist?
Um die Wahrscheinlichkeit zu bestimmen, dass eine Person tatsächlich Corona-infiziert ist, nachdem sowohl der Antigen-Test als auch der PCR-Test positiv ausgefallen sind, können wir den Satz von Bayes verwenden. Wir formulieren die erforderlichen Wahrscheinlichkeiten und wenden die Gesetze der Wahrscheinlichkeit an:
Gegeben:
P(K)=Wahrscheinlichkeit, dass eine Person infiziert ist=0.0002
P(K)=Wahrscheinlichkeit, dass eine Person nicht infiziert ist=0.9998
PAG(T∣K)=Sensitivita¨t des Antigen-Tests=0.90
PAG(T∣K)=Spezifita¨t des Antigen-Tests=0.98
PPCR(T∣K)=Sensitivita¨t des PCR-Tests=0.98
PPCR(T∣K)=Spezifita¨t des PCR-Tests=0.99
Berechnung der Wahrscheinlichkeiten:
Wahrscheinlichkeit, dass beide Tests positiv sind, wenn die Person krank ist:
Die Wahrscheinlichkeit, dass eine Person tatsächlich Corona-infiziert ist, nachdem sowohl der Antigen-Test als auch der PCR-Test positiv ausgefallen sind, beträgt ungefähr 46.8%.
(c) Wie hoch ist die Wahrscheinlichkeit, dass eine infizierte Person nicht erkannt wird?
Aufgepasst!
Es ist wichtig, den Unterschied zu verstehen: P(T∣K) gibt die Wahrscheinlichkeit an, dass der Test negativ ist, obwohl die Person infiziert ist. Dies ist relevant, um die Zuverlässigkeit des Tests zu bewerten. Hingegen bedeutet P(K∣T), dass eine Person tatsächlich infiziert ist, obwohl ihr Test negativ ausgefallen ist. Diese Wahrscheinlichkeit ist wichtig, um das Risiko einer unerkannten Infektion bei einem negativen Testergebnis einzuschätzen.
Die Wahrscheinlichkeit, dass der Antigen-Test negativ ist, obwohl die Person infiziert ist (Fehlalarmrate oder Fehler 2. Art), ist das Komplement der Sensitivität des Tests:
Der Fall Antigen positiv PCR negativ fehlt und muss ergänzt werden
Spezifität benutzen nicht Sensitivität
PAG(T∣K)=1−PAG(T∣K)=1−0.90=0.10PAG(T∣K)=0.10
Diese Wahrscheinlichkeit gibt an, dass 10 % der tatsächlich infizierten Personen durch den Antigen-Test nicht erkannt werden. Der PCR-Test ist nicht nötig, da dieser bei einem negativen Antigen-test nicht ausgeführt wird.
Aufgabenstellung
Alternativ ist folgendes Vorgehen üblich: Es werden nur Personen mit starken Symptomen getestet. Das betrifft etwa 2% der Personen. Wir können annehmen, dass unter diesen etwa 1% der Personen infiziert sind.
Es ändert sich nur die Prävalenz auf 0.01 ist einfach mies formuliert in der Aufgabenstellung
(d) Formulieren Sie die hier dargestellten Ereignisse und Wahrscheinlichkeiten.
Saß zu lange an dieser Aufgabe, hab aufgegeben (easily 1.5h+ input) 🪦
Welche Schritte wie das ganze angehen?
Meine probierte Lösung ist unter dem Trennstrich
Es fehlt P(K) bzw P(K∣S)
Gesucht
Die Wahrscheinlichkeit P(Krank∣T), dass eine Person, die einen positiven PCR-Test hat, tatsächlich mit Corona infiziert ist, nachdem zuvor ein positiver Antigen-Test vorliegt.
Gegeben
P("Krank" | "Starke Symptome")=0.01 (Wahrscheinlichkeit, dass eine Person krank ist, gegeben dass sie starke Symptome zeigt)
P("Starke Symptome")=0.02 (Wahrscheinlichkeit, dass eine Person starke Symptome zeigt)
PPCR(T∣Krank)=0.98 (Sensitivität des PCR-Tests)
PPCR(T∣Krank)=0.99 (Spezifität des PCR-Tests)
PAG(T∣Krank)=0.90 (Sensitivität des Antigen-Tests)
PAG(T∣Krank)=0.02 (Wahrscheinlichkeit eines falsch positiven Antigen-Tests, abgeleitet aus der Spezifität von 98%)
Berechnung
Die Gesamtwahrscheinlichkeit eines positiven PCR-Tests P(T) unter Personen mit einem vorherigen positiven Antigen-Test ist:
P(T)≈0.009018≈(0.9018%)
Die Wahrscheinlichkeit, dass eine Person, die einen positiven PCR-Test hat, tatsächlich mit Corona infiziert ist, gegeben dass zuvor ein Antigen-Test positiv war, beträgt:
P(Krank∣T)≈0.9780≈(97.80%)
Dies berücksichtigt das Vorgehen, bei dem nur Personen mit einem vorherigen positiven Antigen-Test anschließend einen PCR-Test erhalten.
Wir betrachten ein Binomial-Experiment. Sei x∼B(n,π). Wir betrachten im Folgenden zwei Ansätze:
π ist stetig
π sei diskret und nehme Werte auf einem Gitter [0,0.01,0.02,…,0.99,1] an.
(a) Ausgehend von Laplace’ Prinzip vom unzureichenden Grund: Wie sieht in beiden Fällen die Priori von π aus?
Priori Verteilung bedeutet, dass π eine stetige Gleichverteilung ist, die als U(0,1) dargestellt wird
1.Fall:
π ist stetig →b−a1fu¨rπ∈[a,b]
Da a=0 und b=1→f(π)=1fu¨rπ∈[0,1]
Das bedeutet, dass die Wahrscheinlichkeit für jeden Wert von π innerhalb dieses Bereichs gleich ist, und die kumulative Verteilungsfunktion (CDF) ist:
F(π)=πfu¨rx∈[0,1]Fall 2:
π ist diskret und nimmt Werte auf einem Gitter [0,0.01,0.02,…,0.99,1] an
P(π=k)=1011fu¨rk∈{0,0.01,0.02,…,0.99,1}
Erklärung
Das obige zeigt eine Aufgabenstellung zur Bayes-Statistik mit Bezug auf das Laplace’sche Prinzip des unzureichenden Grundes. Wir betrachten ein Binomial-Experiment, bei dem die Wahrscheinlichkeit π eine unbekannte Größe ist, und es wird eine Priori-Verteilung für π auf Basis dieses Prinzips gesucht. Hier wird zwischen zwei Fällen unterschieden: einer stetigen und einer diskreten Verteilung von π.
Stetige Gleichverteilung (Fall 1)
In einer stetigen Gleichverteilung U(a,b) hat jedes Element im Intervall [a,b] die gleiche Wahrscheinlichkeit. Die Dichte f(π) wird als konstant 1/(b−a) für alle π im Intervall angenommen, da die Fläche unter der Dichtefunktion 1 sein muss (was die Gesamtwahrscheinlichkeit repräsentiert). Für a=0 und b=1 (wie es im Fall der Binomialverteilung für eine Wahrscheinlichkeit π sinnvoll ist), ist die Dichte einfach 1/(1−0)=1. Dies bedeutet, dass jedes π im Intervall [0,1] gleich wahrscheinlich ist.
Die kumulative Verteilungsfunktion (CDF) gibt die Wahrscheinlichkeit an, dass die Zufallsvariable π kleiner oder gleich einem bestimmten Wert ist. Für eine stetige Gleichverteilung ist die CDF einfach F(π)=π, weil sie linear von 0 bis 1 ansteigt.
Diskrete Gleichverteilung (Fall 2)
Für eine diskrete Gleichverteilung, bei der die Zufallsvariable π nur bestimmte Werte annehmen kann (hier ein Gitter von 0 bis 1 in Schritten von 0.01), wird jedem dieser Punkte die gleiche Wahrscheinlichkeit zugeordnet. Da es 101 solche Punkte gibt, ist die Wahrscheinlichkeit für jeden Punkt 1/101.
In beiden Fällen geht man davon aus, dass man keine Informationen über π hat, außer dass es zwischen 0 und 1 liegt. Daher behandelt man alle möglichen Werte von π als gleich wahrscheinlich.
In der Bayes-Statistik werden diese Priori-Verteilungen genutzt, um sie mit den Daten zu kombinieren und so eine Posteriori-Verteilung zu erhalten. Diese reflektiert dann sowohl das Vorwissen (die Priori-Verteilung) als auch die Informationen aus den Daten.
(b) Leiten Sie jeweils die Posteriori für π∣x her. [[Erstellung der Posteriori-Verteilung im Bayes’schen Kontext|(Erstellung der Posteriori-Verteilung im Bayes’schen Kontext)
k auswechseln mit x
Lösung
Die Posteriori-Wahrscheinlichkeit p(π∣x) ist die Wahrscheinlichkeit für den Parameter π gegeben die beobachteten Daten x. Um diese zu berechnen, verwenden wir das Bayes’sche Theorem:
p(π∣x)=f(x)f(x∣π)f(π)
Schritte zur Herleitung der Posteriori-Verteilung
Bestimmung der Likelihood f(x∣π):
Die Likelihood-Funktion f(x∣π) für ein Binomial-Experiment mit n Versuchen und k Erfolgen ist gegeben durch die Binomialverteilung:
f(x∣π)=(kn)πk(1−π)n−k
Bestimmung der Priori-Verteilung f(π):
Wenn keine vorherige Information über π vorliegt, nehmen wir an, dass π gleichverteilt ist. Das bedeutet:
Für eine stetige Gleichverteilung:
f(π)=1 fu¨r 0≤π≤1
Für eine diskrete Gleichverteilung auf einem Gitter von 0 bis 1 in Schritten von 0.01:
f(π)=1011
Bestimmung der Marginal Likelihood f(x):
Die Marginal Likelihood f(x) ist die Wahrscheinlichkeit der beobachteten Daten über alle möglichen Werte von π. Dies ist die Summe (im diskreten Fall) oder das Integral (im stetigen Fall) der Likelihood multipliziert mit der Priori-Verteilung.
Für eine stetige Gleichverteilung:
f(x)=∫01(kn)πk(1−π)n−kdπ
Für eine diskrete Gleichverteilung:
f(x)=π∈{0,0.01,…,1}∑1011(kn)πk(1−π)n−k
Berechnung der Posteriori-Verteilung
Mit der Likelihood, der Priori-Verteilung und der Marginal Likelihood können wir nun die Posteriori-Verteilung p(π∣x) berechnen. Diese gibt uns die aktualisierte Wahrscheinlichkeit für π nach dem Beobachten der Daten x.
Verwenden Sie die Posteriori-Verteilung, um aktualisierte Wahrscheinlichkeiten für π zu erhalten, basierend auf den beobachteten Daten x.
(c) Berechnen Sie jeweils den Posteriori-Erwartungswert und den Posteriori-Median für folgende Daten:
n=10,x=3
n=100,x=13
n=1000,x=33
n=10,X=3
Lösung
Posteriori-Erwartungswert und -Median für Binomialdaten
Um den Posteriori-Erwartungswert und den Posteriori-Median für die gegebenen Daten unter Verwendung der zwei unterschiedlichen Priori-Annahmen zu berechnen, müssen wir zuerst das Bayesianische Update für die Wahrscheinlichkeit π durchführen, gegeben die Daten x∼B(n,π), wobei n=10 und x=3. Die Beobachtungen folgen einer Binomialverteilung.
Fall 1: Stetige Gleichverteilung von π (π∼U(0,1))
Priori
Die Priori-Verteilung von π ist U(0,1), was bedeutet, dass sie eine Beta-Verteilung mit Parametern α=1 und β=1 ist: Beta(1,1).
Likelihood
Die Likelihood-Funktion für die Beobachtungen aus einer Binomialverteilung mit den gegebenen Parametern ist proportional zu:
πx(1−π)n−x=π3(1−π)7
Posteriori
Die Posteriori-Verteilung ist das Produkt von Priori und Likelihood, das ebenfalls eine Beta-Verteilung ergibt:
Beta(α+x,β+n−x)=Beta(4,8)
Berechnungen
Der Posteriori-Erwartungswert für eine Beta-Verteilung Beta(a,b) ist:
E[π]=a+ba=4+84=124=31
Der Posteriori-Median kann näherungsweise durch numerische Methoden berechnet werden, da für die Beta-Verteilung keine einfache analytische Lösung für den Median existiert. Der Median liegt jedoch nahe dem Erwartungswert.
Fall 2: Diskrete Gleichverteilung von π
Priori
In diesem Fall ist π diskret verteilt auf dem Gitter [0,0.01,0.02,…,0.99,1], und jeder Wert ist gleich wahrscheinlich.
Likelihood
Wie oben.
Posteriori
Für jede diskrete Stelle πk in [0,0.01,0.02,…,0.99,1] berechnen wir das Posteriori proportional zu:
πk3(1−πk)7
Anschließend normalisieren wir diese Wahrscheinlichkeiten, damit sie sich zu 1 summieren. Die Positionen des höchsten Wertes geben uns den Modus, und wir können die kumulativen Wahrscheinlichkeiten berechnen, um den Median zu finden.
Berechnungen
Der Posteriori-Erwartungswert für dieses Gitter kann näherungsweise berechnet werden als:
E[π]≈k=0∑100πk⋅P(π=πk∣x=3,n=10)
Der Posteriori-Median wird identifiziert, indem die kumulativen Wahrscheinlichkeiten berechnet werden, bis sie 0.5 erreichen.
Für präzisere numerische Berechnungen, besonders im diskreten Fall, sind Softwaretools wie Python oder R hilfreich, um die Wahrscheinlichkeiten zu berechnen und zu normalisieren.
n=100,X=13
Lösung
Posteriori-Erwartungswert und -Median für Binomialdaten
Um den Posteriori-Erwartungswert und den Posteriori-Median für die gegebenen Daten unter Verwendung der zwei unterschiedlichen Priori-Annahmen zu berechnen, müssen wir zuerst das Bayesianische Update für die Wahrscheinlichkeit π durchführen, gegeben die Daten x∼B(n,π), wobei n=100 und x=13. Die Beobachtungen folgen einer Binomialverteilung.
Fall 1: Stetige Gleichverteilung von π (π∼U(0,1))
Priori
Die Priori-Verteilung von π ist U(0,1), was bedeutet, dass sie eine Beta-Verteilung mit Parametern α=1 und β=1 ist: Beta(1,1).
Likelihood
Die Likelihood-Funktion für die Beobachtungen aus einer Binomialverteilung mit den gegebenen Parametern ist proportional zu:
πx(1−π)n−x=π13(1−π)87
Posteriori
Die Posteriori-Verteilung ist das Produkt von Priori und Likelihood, das ebenfalls eine Beta-Verteilung ergibt:
Beta(α+x,β+n−x)=Beta(1+13,1+100−13)=Beta(14,88)
Berechnungen
Der Posteriori-Erwartungswert für eine Beta-Verteilung Beta(a,b) ist:
E[π]=a+ba=14+8814=10214≈0.1373
Der Posteriori-Median kann näherungsweise durch numerische Methoden berechnet werden, da für die Beta-Verteilung keine einfache analytische Lösung für den Median existiert. Der Median wird jedoch in der Nähe des Erwartungswertes liegen, leicht niedriger aufgrund der Schiefe der Verteilung.
Fall 2: Diskrete Gleichverteilung von π
Priori
In diesem Fall ist π diskret verteilt auf dem Gitter [0,0.01,0.02,…,0.99,1], und jeder Wert ist gleich wahrscheinlich.
Likelihood
Wie oben.
Posteriori
Für jede diskrete Stelle πk in [0,0.01,0.02,…,0.99,1] berechnen wir das Posteriori proportional zu:
πk13(1−πk)87
Anschließend normalisieren wir diese Wahrscheinlichkeiten, damit sie sich zu 1 summieren. Die Positionen des höchsten Wertes geben uns den Modus, und wir können die kumulativen Wahrscheinlichkeiten berechnen, um den Median zu finden.
Berechnungen
Der Posteriori-Erwartungswert für dieses Gitter kann näherungsweise berechnet werden als:
E[π]≈k=0∑100πk⋅P(π=πk∣x=13,n=100)
Der Posteriori-Median wird identifiziert, indem die kumulativen Wahrscheinlichkeiten berechnet werden, bis sie 0.5 erreichen.
Für präzisere numerische Berechnungen, besonders im diskreten Fall, sind Softwaretools wie Python oder R hilfreich, um die Wahrscheinlichkeiten zu berechnen und zu normalisieren.
n=1000,X=33
x∼B(n,π), n=1000 und x=33
Fall 1: stetige Gleichverteilung von π (π∼U(0,1) )
# Angenommene Wertex <- 33 # Anzahl der Erfolgen <- 1000 # Gesamtzahl der Versuche# Diskrete Werte für pipi_values <- seq(0, 1, by = 0.01)# Priori-Wahrscheinlichkeiten (gleich für alle Werte)prior_probs <- rep(1/length(pi_values), length(pi_values))# Likelihood-Funktion für jeden Wert von pi berechnenlikelihoods <- dbinom(x, size = n, prob = pi_values)# Posteriori-Wahrscheinlichkeiten berechnenpost_probs <- likelihoods * prior_probspost_probs <- post_probs / sum(post_probs) # Normalisierung# Posteriori-Erwartungswert berechnenposterior_mean <- sum(pi_values * post_probs)# Ausgabe des Posteriori-Erwartungswertesprint(posterior_mean)
Posteriori-Median
Median[π]=πk, fu¨r das gilt i=0∑kP(π=πi∣x=33,n=1000)≥0.5=0.03
Hierbei repräsentiert pik den Wert der diskreten Zufallsvariablen pi an der Stelle k auf dem Gitter, und P(π=πi∣x=33,n=1000) sind die Posteriori-Wahrscheinlichkeiten, kumuliert bis zum Punkt, wo die Summe zum ersten Mal 0,5 übersteigt, was den Median definiert.
# Kumulative Posteriori-Wahrscheinlichkeiten berechnencumulative_post_probs <- cumsum(post_probs)# Finde den Posteriori-Median# Dies ist der erste Wert von pi, bei dem die kumulative Wahrscheinlichkeit >= 0.5 ist.posterior_median <- pi_values[which(cumulative_post_probs >= 0.5)[1]]# Ausgabe des Posteriori-Mediansprint(posterior_median)
(d) Vergleichen Sie die Posteriori-Erwartungswerte und -Mediane mit beiden Ansätzen.
Zusammenfassung der Lösung
Vergleich von Posteriori-Erwartungswerten und Medianen
Die Analyse für n=1000 und x=33 ergibt sowohl im stetigen als auch im diskreten Fall ähnliche Posteriori-Erwartungswerte, mit einem geringfügig höheren Wert im stetigen Fall (E[π]≈0.0339) verglichen mit dem diskreten Fall (E[π]≈0.03382706). Der Posteriori-Median im diskreten Fall (Median[π]=0.03) fällt niedriger aus, was typisch ist, da Mediane durch Extremwerte weniger beeinflusst werden. Im stetigen Fall wurde der Median nicht direkt berechnet, würde aber ähnlich liegen und leicht unter dem Erwartungswert, aufgrund der Schiefe der Beta-Verteilung.
Diese Ergebnisse illustrieren die Konsistenz der Bayesschen Methodik, da beide Ansätze trotz ihrer Unterschiede in Stetigkeit und Diskretheit zu vergleichbaren Schlüssen führen. Die Wahl des Ansatzes sollte auf den spezifischen Kontext der verfügbaren Daten und den gewünschten Detaillierungsgrad der Analyse abgestimmt werden.
Ausführliche Lösung
Stetige Gleichverteilung (Fall 1)
Für den stetigen Fall haben wir eine Beta-Verteilung als Priori genommen und aufgrund der beobachteten Daten die Parameter aktualisiert. Wir hatten dabei angenommen, dass n=1000 und x=33. Die Posteriori-Verteilung wäre dementsprechend eine Beta(34,968)-Verteilung.
Posteriori-Median:
Für Beta-Verteilungen ist eine geschlossene Form für den Median nicht einfach zu berechnen, aber der Median einer Beta(34,968)-Verteilung liegt nahe am Erwartungswert und ist wegen der Schiefe der Verteilung etwas niedriger als der Erwartungswert.
Diskrete Gleichverteilung (Fall 2)
Im diskreten Fall haben wir ein Gitter von möglichen Werten für π betrachtet und für jeden dieser Werte die Posteriori-Wahrscheinlichkeiten berechnet.
Posteriori-Erwartungswert:E[π]≈0.03382706
Posteriori-Median:Median[π]=0.03
Vergleich der Ansätze
Erwartungswerte:
Die Posteriori-Erwartungswerte sind sehr ähnlich, aber nicht identisch, was auf die diskrete Natur des zweiten Ansatzes zurückzuführen ist.
Mediane:
Der Median im diskreten Fall ist explizit angegeben und etwas niedriger als der Erwartungswert. Im stetigen Fall haben wir den genauen Median nicht berechnet, aber aufgrund der Schiefe der Beta-Verteilung können wir erwarten, dass er ebenfalls etwas niedriger als der Erwartungswert ist.
Interpretation
In beiden Fällen spiegeln die Posteriori-Erwartungswerte und -Mediane die aktualisierte Überzeugung über die Erfolgswahrscheinlichkeit nach Berücksichtigung der beobachteten Daten wider. Der Erwartungswert gibt dabei einen zentralen Tendenzpunkt an, während der Median eine alternative punktuelle Schätzung ist, die von Extremwerten weniger beeinflusst wird.
Die Nähe der Ergebnisse zeigt, dass beide Ansätze zu ähnlichen Schlussfolgerungen führen, was die Robustheit der Bayesschen Analyse unterstreicht. In der Praxis würde die Wahl zwischen den Ansätzen von der Art der verfügbaren Informationen und der gewünschten Feinheit der Analyse abhängen.
(e) Welchen Ansatz würden Sie eher bevorzugen?
Aufgabe 4
Aufgabenstellung
Betrachten Sie das Poisson-Modell, d.h. X∼Po(λ) und für den Parameter λ wird eine Ga(α,β)-Priori-Verteilung angenommen.
(a) Berechnen sie die Posteriori-Verteilung p(λ∣X) explizit, d.h. inklusive Normierungskonstante.
Hinweis
Γ(x)=∫0∞tx−1e−tdt.
Die Posteriori-Verteilung ergibt sich aus dem Produkt der Likelihood-Funktion des Poisson-Modells und der Gamma-Priori-Verteilung. Für eine gegebene Anzahl von Ereignissen x ist die Likelihood L(λ)=x!e−λλx. Die Priori-Verteilung ist gegeben durch die Dichtefunktion der Gamma-Verteilung f(λ)=Γ(α)βαλα−1e−βλ.
Das Produkt aus Likelihood und Priori ergibt die nicht normierte Posteriori-Verteilung:
p(λ∣X)∝λα+x−1e−λ(β+1)
Um die Normierungskonstante zu bestimmen, nutzen wir die Definition der Gamma-Funktion:
Γ(α+x)=∫0∞tα+x−1e−tdt
Die Posteriori-Verteilung, inklusive der Normierungskonstante, ist daher eine Gamma-Verteilung Ga(α+x,β+1):
p(λ∣X)=Γ(α+x)(β+1)α+xλα+x−1e−(β+1)λ
(b) Warum genügt es, die Posteriori nur bis auf eine multiplikative Konstante zu bestimmen?
Es genügt, die Posteriori nur bis auf eine multiplikative Konstante zu bestimmen, weil wir meistens an den relativen Wahrscheinlichkeiten von λ interessiert sind und nicht an den absoluten Wahrscheinlichkeiten. Für die meisten bayesianischen Inferenzprobleme, wie die Berechnung von Erwartungswerten oder die Bestimmung von Konfidenzintervallen, kürzt sich die Konstante heraus. Außerdem kann die Konstante oft komplex sein und ihre explizite Berechnung kann unnötig aufwändig sein, insbesondere wenn nur der Posteriori-Modus oder -Median und nicht die vollständige Posteriori-Verteilung von Interesse ist.
Aufgabe 4
Aufgabenstellung
Betrachten Sie das Poisson-Modell, d.h. X∼Po(λ) und für den Parameter λ wird eine Ga(α,β)-Priori-Verteilung angenommen.
(a) Berechnen sie die Posteriori-Verteilung p(λ∣X) explizit, d.h. inklusive Normierungskonstante.
Hinweis
Γ(x)=∫0∞tx−1e−tdt.
(b) Warum genügt es, die Posteriori nur bis auf eine multiplikative Konstante zu bestimmen?
×
MyUniNotes is a free, non-profit project to make education accessible for everyone.
If it has helped you, consider giving back! Even a small donation makes a difference.
These are my personal notes. While I strive for accuracy, I’m still a student myself. Thanks for being part of this journey!