Geschichtete Zufallsstichprobe

Das Ziehen einer geschichteten Zufallsstichprobe (auch: stratifizierte Zufallsstichprobe) kann in der Statistik Vorteile bringen, wenn die Grundgesamtheit in sinnvolle Gruppen, die sogenannten Schichten, unterteilt werden kann. Sinnvoll bedeutet hier, dass die Schichten hinsichtlich eines oder mehrerer Merkmale, die auch die Ausprägung des letztlich interessierenden Merkmals beeinflussen, in sich relativ homogen sind und sich voneinander möglichst deutlich unterscheiden. Typische Schichten, die für Stichproben zur Beantwortung sozialwissenschaftlicher, medizinischer oder Marktforschungs-relevanter Fragestellungen eine Rolle spielen, wären etwa Altersgruppen oder Bevölkerungsschichten nach Einkommen, Bildungsabschluss, Wohnort etc.[1]

Man schränkt nun die rein zufällige Auswahl der Stichprobenelemente insofern ein, als man die Stichprobenumfänge pro Schicht vorgibt und danach in jeder Schicht eine reine Zufallsstichprobe zieht. (Die einzelnen Zufallsstichproben werden getrennt ausgewertet und die Ergebnisse im Anschluss zusammengefasst.) Man „verbietet“ damit extreme Stichproben, die beispielsweise zufällig fast nur Elemente aus einer Schicht enthalten, und bekommt in der Konsequenz bessere Punktschätzer, d. h. Schätzer mit kleinerer Varianz. Durch geeignete Schichtung lässt sich also bei gleicher Ergebnisgenauigkeit der Gesamtstichprobenumfang gegenüber einer einfachen Zufallsstichprobenziehung verringern, was die Kosten der Datenerhebung senkt.[2]

In Monte-Carlo-Simulationen kann man geschichtete Zufallsziehungen als Mittel der Varianzreduktion einsetzen. Die Schichtungsmerkmale (Paradaten) müssen vorab bekannt sein.

Grundgesamtheitsgrößen

Umfang der Grundgesamtheit, Anzahl der Schichten, interessierendes Merkmal. Im Folgenden ist . Umfang der Schicht . Ausprägung des Merkmals in Schicht . relative Schichtstärke. Erwartungswert in Schicht . Varianz in Schicht Es gilt:

.

Die Gesamtvarianz ist die Summe der Varianz in den Schichten und der Varianz zwischen den Schichten.

Schätzer für die Grundgesamtheitsparameter

Wir konzentrieren uns auf die Schätzung von . Seien die Stichprobenumfänge pro Schicht und der Gesamtstichprobenumfang. Seien weiter die Stichprobenwerte aus den Schichten. Dann ist ein erwartungstreuer Schätzer für und eine erwartungstreue Schätzung für . Zum Vergleich mit dem hier interessierenden Schätzer wird das auf reiner Zufallsauswahl beruhende Stichprobenmittel herangezogen.

Schichtungsarten

  • Proportionale Schichtung:

Von einer proportional geschichteten Zufallsstichprobe spricht man, wenn die Umfänge der den verschiedenen Schichten entnommenen Stichproben proportional zum Anteil der Schicht an der Grundgesamtheit sind: So ist jede Schicht in der Stichprobenauswahl in gleicher Relation wie in der Grundgesamtheit vertreten.[1]

Wenn man wählt, dann sind die proportional zum Schichtumfang . ist deutlich kleiner als , wenn sich die Erwartungswerte in den Schichten stark unterscheiden, d. h. wenn die Varianz zwischen den Schichten groß ist.

Bei proportionaler Zweifachschichtung werden die Stichprobenumfänge in den Schichtzellen häufig keine ganzen Zahlen sein, siehe dazu Kontrolliertes Runden.

  • Disproportionale Schichtung:

Sind die Größen der den Schichten entnommenen Zufallsstichproben unabhängig vom Anteil der Schicht an der Grundgesamtheit, handelt es sich um eine disproportional geschichtete Zufallsstichprobe.[1] Im einfachsten Fall werden aus allen Schichten etwa gleich große Zufallsstichproben gezogen. Ein Motiv für ein solches Vorgehen kann z. B. sein, dass die zu entnehmende Zufallsstichprobe für eine sehr kleine Schicht bei proportionaler Schichtung und vertretbarem Aufwand für die Gesamterhebung zu klein für eine sinnvolle statistische Auswertung wäre. So werden etwa bei den Erhebungen für die PISA-Studien disproportional geschichtete Stichproben verwendet, um auch die Eigenschaften kleinerer Schichten wie etwa die der Schüler der kleinen Bundesländer Hamburg und Bremen mit hinreichender Genauigkeit zu ermitteln. (Um die Studienergebnisse insgesamt nicht zu verzerren, werden die aus den einzelnen Schichten gewonnenen Ergebnisse wiederum proportional gewichtet.)[3]

Sonderformen der disproportionalen Schichtung sind die varianzoptimale und die kostenoptimale Schichtung.

  • Varianzoptimale Schichtung:

Wenn

,

dann ist bei stark unterschiedlichen die Varianz von wesentlich kleiner als bei proportionaler Schichtung, weil Schichten mit großer Streuung stärker beprobt werden. Proportionale Schichtung ist varianzoptimal, wenn alle gleich sind.

  • Kostenoptimale Schichtung:

Seien die zur Verfügung stehenden Gesamtkosten und die Kosten für die Auswahl eines Elementes aus Schicht . Wenn man nun die Varianz von minimiert unter der Nebenbedingung, die Kosten nicht zu überschreiten, dann ergibt sich

.

In der Regel ist obiger Wert keine natürliche Zahl und daher zu runden.

Stratifikationsproblematik

Stratifikation ist die Einteilung der Grundgesamtheit in Schichten. Dabei entstehen zwei Teilprobleme:

  1. Die Festlegung der Anzahl der Schichten.
  2. Die Festlegung der Schichtabgrenzung.

Ziel ist es, die beiden Teilprobleme so zu lösen, dass die Schätzungen genauer werden. Dazu bedarf es allerdings meist Vorinformationen über die Grundgesamtheit (etwa durch die Amtliche Statistik oder vorhergehende Untersuchungen).

Eine Lösung o. g. Problematik stellt etwa das Stratifikationsmodell nach Dalenius inklusive entsprechender Näherungslösungen wie die cum-Regel oder die equal aggregate -Regel dar.

Vergleich mit Klumpen-Stichprobe

Bei geschichteten Stichproben und Klumpenstichproben wird die Grundgesamtheit jeweils in Gruppen unterteilt – im Fall der geschichteten Stichprobe sind das die Schichten, bei der Klumpenstichprobe die sogenannten „Klumpen“ oder Cluster. Der wesentliche Unterschied zwischen beiden Stichprobenauswahlverfahren liegt in den statistischen Eigenschaften der Gruppen im Vergleich miteinander und mit der Grundgesamtheit.

Die Anwendung der Klumpenstichprobe beruht auf der Annahme, dass jeder Klumpen ein möglichst ideales verkleinertes Abbild der Grundgesamtheit ist, also dieser bezüglich Erwartungswert und Varianz bzw. Verteilung des interessierenden Merkmals und anderer, eventuell damit korrelierender Merkmale möglichst nahekommt: Die Klumpen sind in sich möglichst so heterogen wie die Grundgesamtheit und einander diesbezüglich idealerweise sehr ähnlich.

Dagegen werden die Schichten der geschichteten Stichprobe zweckmäßig so gewählt, dass sie im Hinblick auf die für die Schichtauswahl relevanten Merkmale in sich wesentlich homogener sind als die Grundgesamtheit (also für diese Merkmale jeweils eine kleinere Varianz als die Grundgesamtheit aufweisen) und sich voneinander bezüglich der Erwartungswerte dieser Merkmale möglichst stark unterscheiden.

Vergleich mit Quotenstichprobe

Die Quotenstichprobe ist der proportional geschichteten Zufallsstichprobe in zwei Aspekten sehr ähnlich: Bei beiden Verfahren geht es darum, erstens die zu untersuchende Grundgesamtheit in Gruppen einzuteilen, die durch bestimmte relevante Merkmale charakterisiert sind; und zweitens aus diesen Gruppen Stichproben zu entnehmen, deren relative Größe durch den Anteil der Gruppe an der Grundgesamtheit bestimmt wird.

Der Unterschied zwischen beiden Verfahren liegt in der Anwendung eines zufälligen oder willkürlichen Auswahlverfahrens für die letztlich in die Stichprobe einbezogenen Individuen/Elemente: Die geschichtete Zufallsstichprobe hat eine angebbare Ziehungswahrscheinlichkeit für jedes Element der Grundgesamtheit, während bei der Quotenstichprobe keine solche Ziehungswahrscheinlichkeit angegeben werden kann. Eine willkürliche Auswahl kann zum Beispiel auf Selbstselektion beruhen: Der Untersucher sucht etwa per Annonce nach geeigneten Studienteilnehmern, kontaktiert passende Mitglieder eines Online-Panels, die sich zur Teilnahme an Meinungsumfragen bereiterklärt haben, oder spricht willkürlich geeignete Passanten an, von denen sich nur einige dafür entscheiden, ihm zu antworten. Das tut er so lange, bis er die Quoten für seine Stichproben erfüllt hat. Sofern nun die Eigenschaften der Teilnehmer, die sie zur Selbstselektion bewogen haben, auch das interessierende Merkmal beeinflussen, werden die Ergebnisse der Quotenstichprobe gegenüber der Ergebnissen einer geschichteten Zufallsstichprobe verzerrt sein (ähnliches passiert bei einer Zufallsstichprobe allerdings durch Antwortausfall[4]). Auch von Seiten des Interviewers kann es bei der Quotenstichprobe zur Stichprobenverzerrung kommen, indem z. B. sympathiebasiert Passanten angesprochen werden oder eine Liste von Telefonnummern in einer bestimmten Reihenfolge „abgearbeitet“ wird.

Quotenstichproben sind billiger, schneller und in ihren Voraussetzungen weniger anspruchsvoll als geschichtete Zufallsstichproben; in vielen Fällen können sie ein praktikabler Ersatz für diese sein. Quotenstichproben sind die Methode der Wahl in der kommerziellen Markt- und Meinungsforschung und werden durchaus auch in der akademischen Forschung eingesetzt.[5][6]

Literatur

  • L. Kish: Survey Sampling. Wiley, 1965, speziell S. 75–112 (Chapter 3: Stratified sampling)
  • H. Stenger: Stichprobentheorie. Physica-Verlag, 1971, speziell S. 115–150 (Kapitel 6: Schichtung)
  • J. Hartung: Statistik. 15. Auflage. Oldenbourg, München 2009, speziell die Seiten 278–287 (Kapitel V, Abschnitt 1.5: Geschichtete Zufallsauswahl)
  • W. G. Cochran: Sampling Techniques. 3. Auflage. Wiley, New York 1977, speziell S. 89–149 (Chapter 5: Stratified random sampling sowie Chapter 5A: Further aspects of stratified sampling)

Einzelnachweise

  1. a b c Marcus M. Gillhofer: Teilnehmer-Rekrutierung in der Online-Sozialforschung. Joseph Eul Verlag, Lohmar 2010, ISBN 978-3-89936-905-2, 5.2.2 Die geschichtete Zufallsstichprobe, S. 68 f. (books.google.de).
  2. Rüdiger Jacob: Vorlesung „Methoden und Techniken der empirischen Sozialforschung – 7. Auswahlverfahren“. (PDF) Universität Trier, abgerufen am 6. November 2019.
  3. Zur Stichprobenziehung innerhalb der PISA-Erweiterung. (PDF) Max-Planck-Institut für Bildungsforschung, abgerufen am 6. November 2019.
  4. R.G.Cumming: Is probability sampling always better? A comparison of results from a quota and a probability sample survey. In: Community Health Studies. 14, Nr. 2, 1990, S. 37-7. doi:10.1111/j.1753-6405.1990.tb00033.x. PMID 2208977.
  5. Michael Meyer, Thomas Reutterer: Qualitative Marktforschung: Konzepte, Methoden, Analysen. Hrsg.: Renate Buber, Hartmut H. Holzmüller. Gabler, Wiesbaden 2007, ISBN 978-3-8349-0229-0, Sampling-Methoden in der Marktforschung, S. 239 (books.google.de).
  6. Duane R. Monette, Thomas J. Sullivan, Cornell R. DeJong: Applied Social Research: A Tool for the Human Services. Brooks/Cole, Belmont 2011, ISBN 978-0-8400-3205-8, Quota Sampling, S. 152 (englisch, books.google.de).