Eine Pivotstatistik, auch Pivot-Größe genannt, kurz ein Pivot, ist eine spezielle Funktion in der mathematischen Statistik. Es handelt sich um Statistiken mit bestimmten Invarianzeigenschaften, die zur Konstruktion von Konfidenzbereichen verwendet werden. Der Name leitet sich ab vom französischen pivot (deutsch Anker, hier im Sinne von Dreh- und Angelpunkt)[1] und beruht auf den Invarianzeigenschaften.
Definition
Gegeben sei ein statistisches Modell
Ein Pivot ist eine Zufallsvariable als Funktion von der Stichprobenvariable und , deren Verteilung unabhängig von ist.[2]
Streng formell wird eine Pivotstatistik wie folgt definiert: Gegeben seien ein Entscheidungsraum und eine zu schätzende Funktion
- .
Meist ist . Dann heißt eine messbare Abbildung
eine Pivotstatistik für , wenn sie folgende Eigenschaften erfüllt:[3]
- Für alle und alle ist die Menge in enthalten.
- Es existiert eine Wahrscheinlichkeitsverteilung auf , so dass für alle stets gilt.
Beispiel
Gegeben sei ein festes und sei die Normalverteilung mit Erwartungswert und Varianz . Sei das n-fache Produktmaß.
Betrachtet wird als statistisches Modell das Produktmodell bei fester Varianz und unbekanntem Erwartungswert.
Dann ist eine Pivot-Statistik gegeben durch
- .
Hierbei ist
das Stichprobenmittel. Dass es sich um ein Pivot handelt, folgt direkt aus den Rechenregeln für normalverteilte Zufallsvariablen (siehe Invarianz der Normalverteilung gegenüber Faltung), denn es ist . Durch Normierung mit der Standardabweichung erhält man, dass immer standardnormalverteilt ist, also für alle .
Konstruktion von Konfidenzbereichen mittels Pivots
Existiert eine Pivotstatistik und ist eine Menge gegeben, so wird durch
ein Bereichsschätzer definiert.[3] Aufgrund der Definition des Bereichsschätzers ist dann
und somit
für alle aufgrund der Pivoteigenschaft von . Der Bereichsschätzer liefert also einen Konfidenzbereich zum Konfidenzniveau . Die Wahl der Menge bestimmt somit Konfidenzniveau und Geometrie des Konfidenzbereiches.
Beispiel zur Konstruktion von Konfidenzbereichen
Unter denselben Rahmenbedingungen wie im obigen Beispiel soll ein Konfidenzbereich für den Mittelwert zum Konfidenzniveau bestimmt werden. Da ist, muss zuerst eine Menge gewählt werden, so dass
- .
Die Wahl von hängt im Wesentlichen von der Anwendung ab. Gängig sind einseitige Konfidenzintervalle
- oder
oder zweiseitige Konfidenzintervalle
- .
Dabei müssen nun so gewählt werden, dass für ist. Dafür wählt man die passenden -Quantile der Standardnormalverteilung aus und erhält sowie und .
Damit ergibt sich für den Bereichsschätzer mit der Menge
- ,
da aufgrund der Symmetrie der Standardnormalverteilung gilt.
Als einseitiges Konfidenzintervall zum Konfidenzniveau für den Erwartungswert erhält man somit
- .
Durch analoges Vorgehen mit den Mengen und erhält man als zweites einseitiges Konfidenzintervall
und als beidseitiges Konfidenzintervall
- .
Verwandte Konzepte
Eng mit den Pivotstatistiken sind die approximativen Pivotstatistiken verwandt. Sie dienen der Konstruktion von approximativen Konfidenzbereichen und beruhen auf Grenzwertbetrachtungen.
Einzelnachweise
- ↑ Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 234, doi:10.1515/9783110215274.
- ↑ Claudia Czado, Thorsten Schmidt: Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011, ISBN 978-3-642-17260-1, S. 142, doi:10.1007/978-3-642-17261-8.
- ↑ a b Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, S. 231, doi:10.1007/978-3-642-41997-3.