Reguläres statistisches Modell
Ein reguläres statistisches Modell oder kurz reguläres Modell ist ein spezielles statistisches Modell, in dem noch gewisse Zusatzannahmen gelten. Diese Zusatzannahmen liefern die Existenz weitreichender Eigenschaften wie beispielsweise die Existenz der Score-Funktion und damit auch der Fisher-Information. Manche Autoren nennen diese Zusatzannahmen auch Cramér-Rao-Regularitätsbedingungen[1], da sie häufig im Kontext der Cramér-Rao-Ungleichung verwendet werden. Nicht alle Autoren verwenden dieselben Zusatzannahmen an das statistische Modell. Dieser Artikel gibt eine Übersicht über die auftretenden Regularitätsvoraussetzungen und die möglichen Schlussfolgerungen.
Definition
Gegeben sei ein statistisches Modell , für das gilt:
- Es ist ein einparametrisches Modell. Es ist also .
- Jedes Wahrscheinlichkeitsmaß besitzt eine Dichtefunktion bezüglich eines σ-endlichen Maßes , das heißt ist eine dominierte Verteilungsklasse. In den meisten Fällen ist die Dichtefunktion eine Wahrscheinlichkeitsdichtefunktion, wird also durch das Lebesgue-Maß dominiert (stetiger Fall), oder eine Zähldichte, wird also vom Zählmaß dominiert (diskreter Fall).
Das statistische Modell heißt dann ein reguläres statistisches Modell, wenn gilt:
- ist ein offenes Intervall. Dies ist notwendig, um die Wohldefiniertheit der Differentiation nach zu garantieren. Manche Autoren fordern hier auch nur, dass eine offene Menge sein soll.
- Die Dichtefunktion ist auf ganz echt größer als 0. Diese Forderung ist notwendig, um bei der Definition der Score-Funktion logarithmieren zu können. Manche Autoren fordern die echte Positivität nur auf einer Menge , die nicht von dem Parameter abhängt. Diese Definition erlaubt mehr Spielraum bei Definition der Grundmenge.
- Die Score-Funktion
- existiert und ist endlich. Manche Autoren fordern hier etwas stärker, dass die Dichtefunktion nach stetig differenzierbar sein soll. Wichtig ist hier nur, dass die Score-Funktion existiert und endlich ist, um auf ihr aufbauend die Fisher-Information zu definieren.
- Es ist
- .
- Die Fisher-Information soll also echt positiv und endlich sein. Dies garantiert die Wohldefiniertheit der Cramér-Rao-Ungleichung, wo die Fisher-Information im Nenner steht.
- Es gilt die Vertauschungsrelation
- .
- Daraus folgt, dass die Score-Funktion zentriert ist, es ist also . Damit vereinfacht sich die Fisher-Information zu .
- Manche Autoren fordern, dass die stärkere Vertauschungsrelation
- .
- für alle mit endlicher Varianz gilt. Diese enthält die obere Vertauschungsrelation als Spezialfall. Sie ist für den Beweis der Cramér-Rao-Ungleichung notwendig[2]. Wird sie nicht im Rahmen der Regularität des statistischen Modells gefordert, so wird sie als separate Eigenschaft in der Formulierung der Cramér-Rao-Ungleichung gefordert[3] (siehe beispielsweise regulärer erwartungstreuer Schätzer).
Verwendung
Hauptaufgabe eines regulären statistischen Modells ist es, die Rahmenbedingungen für den Beweis der Cramér-Rao-Ungleichung zu liefern. Aus dieser ergeben sich weitreichende Folgen:
- Sie liefert eine untere Schranke für die Varianz von Schätzern und damit Kriterien für deren Qualität und für gleichmäßig beste erwartungstreue Schätzer.
- Sie liefert die Definition eines Cramér-Rao-effizienten Schätzers und damit einen (nicht asymptotischen) Effizienzbegriff für Schätzer.
- Aus ihr lässt sich die Exponentialfamilie motivieren.
Literatur
- Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, doi:10.1007/978-3-642-41997-3.
- Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, doi:10.1515/9783110215274.
- Claudia Czado, Thorsten Schmidt: Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011, ISBN 978-3-642-17260-1, doi:10.1007/978-3-642-17261-8.