Überdeckungswahrscheinlichkeit

In der Statistik gibt die Überdeckungswahrscheinlichkeit (auch Konfidenzniveau) eines Konfidenzintervalls die Wahrscheinlichkeit an, dass dieses Intervall den wahren Wert enthält.

Der Vertrauensbereich zielt entsprechend seiner Konstruktion darauf ab, mit einer bestimmten Wahrscheinlichkeit den unbekannten Parameter zu enthalten. Dies ist das „Konfidenzniveau“, das als nominelle Überdeckungswahrscheinlichkeit bei der Konstruktion des Konfidenzintervalls verwendet und oft bei 95 Prozent gewählt wird. Die Überdeckungswahrscheinlichkeit ist nun die tatsächliche Wahrscheinlichkeit, dass das resultierende Konfidenzintervall (eine zufällige Menge) den wahren (fixen) Parameter enthält.

Definition

Das Konfidenzniveau (auch Überdeckungswahrscheinlichkeit) zu einem Parameter erfüllt zusammen mit den Statistiken , welche die Grenzen des -Konfidenzintervalls sind, die folgende Wahrscheinlichkeitsbedingung

Der Begriff der Wahrscheinlichkeit in der Überdeckungswahrscheinlichkeit bezieht sich auf eine Menge von hypothetischen Wiederholungen des gesamten Datenerfassungs- und Analyseverfahrens. Bei diesen hypothetischen Wiederholungen werden unabhängige Datensätze mit der gleichen Wahrscheinlichkeitsverteilung betrachtet, und ein Vertrauensintervall für jeden dieser Datensätze berechnet.

Konservative versus permissive Konfidenzintervalle

Wenn alle bei der Konstruktion des Konfidenzintervalls verwendeten Annahmen erfüllt sind, wird die nominelle Überdeckungswahrscheinlichkeit mit der (tatsächlichen) Überdeckungswahrscheinlichkeit zusammenfallen. Ist dies hingegen nicht gegeben, so kann die tatsächliche Überdeckungswahrscheinlichkeit kleiner oder größer als die nominelle sein. Wenn die tatsächliche Überdeckungswahrscheinlichkeit größer als die nominelle ist, wird das Intervall bzw. die Methode zu seiner Berechnung als "konservativ" bezeichnet, wenn sie kleiner ist als "antikonservativ" oder "permissiv". Eine Diskrepanz zwischen der tatsächlichen und der nominellen Überdeckungswahrscheinlichkeit tritt häufig bei der Näherung einer diskreten Verteilung durch eine kontinuierliche auf. Die Konstruktion des Konfidenzintervalls für die Erfolgswahrscheinlichkeit der Binomialverteilung ist ein klassisches Beispiel, bei dem tatsächliche und nominelle Überdeckungswahrscheinlichkeit selten übereinstimmen[1][2][3].

Weblinks

Einzelnachweise

  1. Alan Agresti, Coull, Brent: Approximate Is Better than "Exact" for Interval Estimation of Binomial Proportions. In: The American Statistician. 52, Nr. 2, 1998, S. 119–126. JSTOR 2685469 . doi:10.2307/2685469.
  2. Lawrence Brown, Cai, T. Tony; DasGupta, Anirban: Interval Estimation for a binomial proportion. In: Statistical Science. 16, Nr. 2, 2001, S. 101–117. doi:10.1214/ss/1009213286.
  3. Robert Newcombe: Two-sided confidence intervals for the single proportion: Comparison of seven methods.. In: Statistics in Medicine. 17, Nr. 2, issue 8, 1998, S. 857–872. doi:10.1002/(SICI)1097-0258(19980430)17:8<857::AID-SIM777>3.0.CO;2-E. PMID 9595616.