Normal-Approximation
Die Normal-Approximation ist eine Methode der Wahrscheinlichkeitsrechnung, um die Binomialverteilung für große Stichproben durch die Normalverteilung anzunähern. Hierbei handelt es sich um eine Anwendung des Satzes von Moivre-Laplace und damit auch um eine Anwendung des Zentralen Grenzwertsatzes.
Formulierung
Für eine binomialverteilte Zufallsvariable mit dem Erwartungswert und der Standardabweichung gilt nach dem Satz von Moivre-Laplace
- ,
wobei die Wahrscheinlichkeitsverteilungsfunktion der Standardnormalverteilung bezeichnet.
Diesen asymptotischen Zusammenhang verwendet man zur Rechtfertigung der Approximation der Verteilungsfunktion von durch die Verteilungsfunktion der Normalverteilung für endliches, aber hinreichend große , d. h.
Mit dieser Approximation der Verteilungsfunktion erhält man für mit
Eine exakte Berechnung der Wahrscheinlichkeit würde dagegen durch
erfolgen.
Güte der Approximation
Für viele Anwendungen gilt die Näherung als hinreichend gut, falls gilt.[1][2][3] Falls dies nicht gilt, so sollte zumindest und gelten.[4][5] Je asymmetrischer die Binomialverteilung ist, d. h. je größer die Differenz zwischen und ist, umso größer sollte sein.
Für nahe an 0 ist zur Näherung die Poisson-Approximation besser geeignet. Dabei wird die Binomialverteilung durch eine Poissonverteilung mit dem Parameter approximiert. Für nahe an 1 sind beide Approximationen schlecht, dann kann jedoch statt betrachtet werden, d. h. bei der Binomialverteilung werden Erfolge und Misserfolge vertauscht. ist wieder binomialverteilt mit Parametern und und kann daher mit der Poisson-Approximation angenähert werden.
Stetigkeitskorrektur
Mit der Stetigkeitskorrektur wird eine verbesserte Approximation von Wahrscheinlichkeiten der Binomialverteilung berechneten Wahrscheinlichkeiten durch die Wahrscheinlichkeiten aus der Normalverteilungsapproximation mit den Parametern und und der Verteilungsfunktion angestrebt.
Die Grundidee ist, den Stellen der Binomialverteilung die Wahrscheinlichkeiten der Normalverteilung in den Intervallen
zuzuordnen. Für gilt dann
Für einen Wert ergeben sich mit Verwendung der Stetigkeitskorrektur die Approximationen
und
Für zwei Werte mit ergibt sich mit Verwendung der Stetigkeitskorrektur die Approximation
Beispiele
Beispiel 1
Ein fairer Würfel wird 1000 Mal geworfen. Gesucht ist die Wahrscheinlichkeit, dass mindestens 100 und höchstens 150 Mal die Sechs gewürfelt wird.
- Berechnung mit Binomialverteilung
- Die Zufallsvariable , die die zufällige Anzahl der gewürfelten Sechsen bei Versuchen beschreibt, ist binomialverteilt mit den Parametern und , es gilt also .[6] Die gesuchte Wahrscheinlichkeit ist daher
- Mit einer Wahrscheinlichkeit von ca. 8,4 % wird also bei 1000 Versuchen zwischen 100 und 150 Mal die Sechs gewürfelt.
- Berechnung mit Normal-Approximation
- Es ist . Entsprechend der Faustformel gilt die approximierte Lösung also ausreichend genau. Die beiden Parameter für die Approximation der Binomialverteilung durch eine Normalverteilung sind und
- Die Approximation ohne Stetigkeitskorrektur, wobei die Verteilungsfunktion der Binomialverteilung durch die Verteilungsfunktion einer Normalverteilung mit denselben Parametern approximiert wird, ist
- Die Approximation ohne Stetigkeitskorrektur, wobei die Verteilungsfunktion der Binomialverteilung durch die Verteilungsfunktion einer Normalverteilung mit denselben Parametern approximiert wird, ist
- Berechnung mit Normal-Approximation und Stetigkeitskorrektur
- Die Approximation mit Stetigkeitskorrektur ist
Die Werte können numerisch bestimmt werden oder aus Tabelle abgelesen werden, da keine explizite Stammfunktion existiert. Die approximierte Lösung ist häufig numerisch günstiger, da keine umfangreichen Berechnungen der Binomialkoeffizienten durchgeführt werden müssen.
Beispiel 2
Gegeben sei eine binomialverteilte Zufallsvariable mit den Parametern und , dann hat den Erwartungswert und die Varianz . Die Binomialverteilung wird durch eine Normalverteilung mit dem Mittelwert und der Varianz approximiert.
Nun suchen wir die Antwort auf die Frage: „Wie groß ist die Wahrscheinlichkeit, dass Werte kleiner oder gleich 3 annimmt?“ bzw. „Wie groß ist die Wahrscheinlichkeit ?“ Da ist, handelt es sich um eine kleine Wahrscheinlichkeit im linken Verteilungsende, die exakt mit Hilfe der Binomialverteilung oder approximativ aus der Normalverteilung berechnet werden kann. Für diese Fragestellung und Parameterkonstellation ergeben sich folgende Resultate:
- Berechnung mit der Binomialverteilung
- Abschätzung mit der Normalverteilung
- Abschätzung mit Normalverteilung und Stetigkeitskorrektur
Die Berechnung mit der Normalverteilung ohne Stetigkeitskorrektur überschätzt die Wahrscheinlichkeit. Dies ist darauf zurückzuführen, dass die Binomialverteilung bei dieser Parameterkonstellation eine Schiefe aufweist, die dazu führt, dass die Normalverteilung im linken Verteilungsende die entsprechenden Wahrscheinlichkeiten überschätzt und im rechten Verteilungsende überschätzt. Ob dieser Approximationsfehler akzeptabel ist, hängt von der Anwendung und Fragestellung ab. Der absolute Approximationsfehler 0,001343 - 0,0007882 liegt unter 0,001 und kann damit z. B. in solchen statistischen Anwendungsfällen akzeptabel sein, bei denen Konfidenz- und Signifikanzniveaus in einer der groben Stufen festgelegt werden. Anderseits ist der relative Approximationsfehler (0,001343 - 0,0007882)/0,0007882 = 70,39 %. Dies kann bei anderen Anwendungen eine unakzeptable Ungenauigkeit der zu bestimmenden Wahrscheinlichkeit sein.
Die Verwendung der Stetigkeitskorrektur verschlechtert bei dieser Konstellation die Approximation durch die Normalverteilung, da durch die Berücksichtigung zusätzlicher Wahrscheinlichkeitsmasse die Überschätzung durch die Normalverteilung weiter verstärkt wird. Das Beispiel zeigt insofern die Problematik einer standardmäßigen Anwendung der Stetigkeitskorrektur, wenn damit die Vorstellung einer gleichmäßigen Verbesserung verbunden ist.
Literatur
- Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. Vieweg, Braunschweig 1988, ISBN 978-3-528-07259-9, doi:10.1007/978-3-322-96418-2.
- Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik, 4. Auflage, de Gruyter, 2009, ISBN 978-3-11-021526-7, doi:10.1515/9783110215274.
Einzelnachweise
- ↑ Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 304.
- ↑ Michael Sachs: Wahrscheinlichkeitsrechnung und Statistik für Ingenieurstudenten an Fachhochschulen. Fachbuchverlag Leipzig, München 2003, ISBN 3-446-22202-2, S. 129–130
- ↑ Christian Hassold, Sven Knoth, Detlef Steuer; Formelsammlung Statistik I & II. Beschreibende Statistik - Wahrscheinlichkeitsrechnung - Schließende Statistik; Hamburg 2010, S. 25 (Memento vom 9. Februar 2016 im Internet Archive), zuletzt abgerufen 9. Februar 2016.
- ↑ K.Zirkelbach, W.Schmid; Kommentierte Formelsammlung Statistik I und II. Deskriptive Statistik - Wahrscheinlichkeitsrechnung; Frankfurt(Oder) 2008, S. 29.
- ↑ Formelsammlung zur Vorlesung Statistik I/II für Statistiker, Mathematiker und Informatiker (WS 08/09); LMU München 2008, S.23, zuletzt abgerufen 9. Februar 2016.
- ↑ Etwas "exakter": Zur Modellierung definiert man den Wahrscheinlichkeitsraum mit der Ergebnismenge der Anzahl der gewürfelten Sechsen. Die σ-Algebra ist dann kanonisch die Potenzmenge der Ergebnismenge und die Wahrscheinlichkeitsverteilung die Binomialverteilung , wobei ist und .