Auswahlsatz

Der Auswahlsatz, auch Auswahl-, Inklusions-, Ziehungs- oder Einschlusswahrscheinlichkeit, selten Stichprobengewichte (engl. inclusion probability), gibt an, mit welcher Wahrscheinlichkeit eine oder mehrere Elemente einer Grundgesamtheit in eine Zufallsstichprobe gelangen. Inklusionswahrscheinlichkeiten lassen sich nur für Zufallsstichproben berechnen.

Als Inklusionswahrscheinlichkeit 1. Ordnung wird die Wahrscheinlichkeit bezeichnet, dass das i-te Element der Grundgesamtheit in einer Stichprobe vom Umfang enthalten ist. Analog ist die Inklusionswahrscheinlichkeit 2. Ordnung (mit ) die Wahrscheinlichkeit mit der das i-te und j-te Element in eine Stichprobe vom Umfang gelangen.

Bei einer uneingeschränkten oder einfachen Zufallstichprobe lassen sich die Inklusionswahrscheinlichkeiten direkt angeben. Bei komplexeren Stichprobenverfahren treten Designeffekte auf. Hier hat auch nicht jedes Element die gleiche Wahrscheinlichkeit, in die Stichprobe zu gelangen.

Berechnung der Inklusionswahrscheinlichkeiten

Die Inklusionswahrscheinlichkeit 1. Ordnung lässt bei einer uneingeschränkten oder einfachen Zufallstichprobe mittels der hypergeometrischen Verteilung berechnen:

Die hypergeometrische Verteilung beschreibt also die Wahrscheinlichkeit dafür, dass bei N gegebenen Elementen („Grundgesamtheit des Umfangs N“), von denen M die gewünschte Eigenschaft besitzen, beim Herausgreifen von n Probestücken („Stichprobe des Umfangs n“) genau k Treffer erzielt werden, d. h. die Wahrscheinlichkeit für X = k Erfolge in n Versuchen.

Da es nur ein i-tes Element in der Grundgesamtheit gibt, ist M=1 und entweder zieht man es (k=1) oder nicht (k=0):

Demnach gilt:

Analog lassen sich die Inklusionswahrscheinlichkeit 2. Ordnung für eine uneingeschränkte Zufallstichprobe berechnen; hier gilt M=2 und k=2:

Beispiel

Die Grundgesamtheit besteht aus vier Elementen: {w1 , w2 , w3 , w4 }. Wir betrachten drei Stichproben des Umfangs n = 2, und zwar {w1 , w3 }, {w2 , w4 } und {w3 , w4 }. Bei einer uneingeschränkten Zufallstichprobe gäbe es insgesamt mögliche Stichproben; d. h. sind nur die drei obigen Stichproben möglich handelt es sich nicht um eine uneingeschränkte Zufallstichprobe.

Die Wahrscheinlichkeit für jede der Stichproben ist gerade 1/3 und die Inklusionswahrscheinlichkeiten ergeben sich zu

Inklusionswahrscheinlichkeitw1w2w3w4
1. Ordnung1/31/32/32/3
2. Ordnungw1w2w3w4
w101/30
w201/3
w31/3
w4

Designeffekt

Der Designeffekt ist das Verhältnis der Varianz einer Schätzfunktion bei gegebenem Stichprobendesign zur Varianz der Schätzfunktion bei einfacher Zufallsauswahl (und demselben Stichprobenumfang). Er beschreibt die statistische Verzerrung, die durch ein spezielles Auswahlverfahren einer Stichprobe (Schichtung, Klumpung, Mehrstufige Ziehung) im Vergleich zur reinen Zufallsauswahl (simple random sample) entstanden ist. Designeffekte treten dadurch auf, dass nicht alle Elemente die gleiche Auswahlwahrscheinlichkeit besitzen, d. h. die Chance in die Stichprobe zu gelangen. Durch geeignete Varianzschätzung und Mittelwertschätzung können die Grundgesamtheitsparameter dennoch gut geschätzt werden.

Literatur

  • Shadish, W. R., Cook, T. D. & Campbell, D. T. (2002). Experimental and quasi-experimental designs for generalized causal inference. Boston: Houghton-Mifflin.
  • Rossi, P. H. & Freeman, H. E. (1999). Evaluation: A systematic approach. Thousand Oaks: Sage.
  • Döring, N. & Bortz, J. (2016). Forschungsmethoden und Evaluation (5. Aufl.). Heidelberg: Springer.