Poisson-Approximation

Vergleich der Poisson-Verteilung (schwarze Linien) und der Binomialverteilung mit (rote Kreise), (blaue Kreise), (grüne Kreise). Alle Verteilungen haben einen Erwartungswert von 5. Die horizontale Achse zeigt die Anzahl der eingetretenen Ereignisse . Je größer wird, umso besser ist die Approximation der Binomialverteilung durch die Poisson-Verteilung.

Die Poisson-Approximation ist in der Wahrscheinlichkeitsrechnung eine Möglichkeit, die Binomialverteilung und die verallgemeinerte Binomialverteilung für große Stichproben und kleine Wahrscheinlichkeiten durch die Poisson-Verteilung anzunähern. Durch den Grenzübergang nach unendlich erhält man dann die Konvergenz in Verteilung der beiden Binomialverteilungen gegen die Poisson-Verteilung.

Formulierung

Ist eine Folge binomialverteilter Zufallsvariablen mit Parametern und , sodass für die Erwartungswerte für gilt, dann folgt

für .

Beweis-Skizze

Der Wert einer Poisson-verteilten Zufallsvariable an der Stelle ist der Grenzwert einer Binomialverteilung mit an der Stelle :

Bei großen Stichproben und kleinem lässt sich folglich die Binomialverteilung gut durch die Poisson-Verteilung approximieren.

Die Darstellung als Grenzwert der Binomialverteilung erlaubt eine alternative Berechnung von Erwartungswert und Varianz der Poisson-Verteilung. Seien unabhängige bernoulliverteilte Zufallsvariablen mit und sei . Für gilt und

Güte der Approximation

Für die Fehlerabschätzung gilt

.

Die Approximation einer Summe von Bernoulli-verteilten Zufallsvariablen (bzw. einer binomialverteilten Zufallsvariable) ist also insbesondere für kleine gut. Als Faustregel gilt, dass die Approximation gut ist, wenn und gilt. Ist , so ist die Normal-Approximation besser geeignet.

Verallgemeinerung

Allgemeiner lässt sich Folgendes zeigen: Sind stochastisch unabhängige Zufallsvariablen mit (Jede Zufallsvariable ist also Bernoulli-verteilt). Dann ist

verallgemeinert binomialverteilt und es ist

.

Dann gilt

.

Gilt für alle , so ist binomialverteilt und das obige Ergebnis folgt sofort.

Beispiel

Ein Individuum einer Spezies zeugt Nachkommen, die alle stochastisch unabhängig voneinander mit einer Wahrscheinlichkeit von das geschlechtsreife Alter erreichen. Interessiert ist man nun an der Wahrscheinlichkeit, dass zwei oder mehr Nachkommen das geschlechtsreife Alter erreichen.

Exakte Lösung

Sei die Zufallsvariable „Der -te Nachkomme erreicht das geschlechtsreife Alter“. Es gilt und für alle . Dann ist die Anzahl der überlebenden Nachkommen aufgrund der stochastischen Unabhängigkeit -verteilt. Zur Modellierung definiert man den Wahrscheinlichkeitsraum mit der Ergebnismenge , der Anzahl der überlebenden geschlechtsreifen Nachkommen. Die σ-Algebra ist dann kanonisch die Potenzmenge der Ergebnismenge: und als Wahrscheinlichkeitsverteilung die Binomialverteilung: . Gesucht ist . Es erreichen also mit einer Wahrscheinlichkeit von ca. 26 % mindestens zwei Individuen das geschlechtsreife Alter.

Approximierte Lösung

Da ausreichend groß und ausreichend klein ist, lässt sich die Binomialverteilung genügend genau mittels der Poisson-Verteilung annähern. Diesmal ist der Wahrscheinlichkeitsraum definiert mittels des Ergebnisraums , der -Algebra und der Poisson-Verteilung als Wahrscheinlichkeitsverteilung mit dem Parameter . Man beachte hier, dass die beiden modellierten Wahrscheinlichkeitsräume unterschiedlich sind, da die Poisson-Verteilung auf einem endlichen Ergebnisraum keine Wahrscheinlichkeitsverteilung definiert. Die Wahrscheinlichkeit, dass mindestens zwei Individuen das geschlechtsreife Alter erreichen, ist also .

Bis auf vier Nachkommastellen stimmt also die exakte Lösung mit der Poisson-Approximation überein.

Weblinks

Literatur

  • Achim Klenke: Wahrscheinlichkeitstheorie. 3. Auflage. Springer-Verlag, Berlin Heidelberg 2013, ISBN 978-3-642-36017-6, doi:10.1007/978-3-642-36018-3.
  • Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. Für Studium, Berufspraxis und Lehramt. 8. Auflage. Vieweg, Wiesbaden 2005, ISBN 3-8348-0063-5, doi:10.1007/978-3-663-09885-0.
  • Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, doi:10.1515/9783110215274.

Auf dieser Seite verwendete Medien

Binomial versus poisson.svg
Autor/Urheber: Sergio01, Lizenz: CC BY-SA 3.0
Comparison of the Poisson distribution (black dots) and the binomial distribution with n=10 (red line), n=20 (blue line), n=1000 (green dots). All distributions have a mean of 5.
Source Code
svg("poisson-vs-binomial.svg", width=4, height=4)
x <- 0:10
pmean <- 5
pal <- c("black", "tomato", "royalblue", "darkgreen")
par0 <- par(mar=c(4,4,0.5,0)+0.5)
plot.new(); plot.window(range(x), c(0,max(dbinom(x, 10, pmean/10))))
axis(1); axis(2); title(xlab=expression(k), ylab=expression(Density(k)))
abline(h=0, lwd=0.1)
lines(x, dpois(x, pmean), type="h", lwd=2, col=pal[[1]])
for (i in 1:3) {
  n <- c(10, 20, 1000)[[i]]
  y <- dbinom(x, n, pmean/n)
  lines(x, y, type="b", col=pal[[i+1]], pch=NA, lty=3, lwd=0.5)
  points(x, y, col=pal[[i+1]], lwd=2)
}
legend("topright", expression(Poisson(lambda==5),
    Binom(n==10),Binom(n==20),Binom(n==1000)),
  lwd=2, lty=c(1,NA,NA,NA), pch=c(NA,1,1,1), col=pal, cex=0.6)
par(par0)
dev.off()