Schnelltest nach Tukey
Der Schnelltest nach Tukey, auch als Tukey’s Quick Test, Tukey’s Pocket Test, Tukey-Duckworth-Test oder Tail Count Test bezeichnet, ist ein statistischer Test, mit dem zwei unabhängige Stichproben im Hinblick auf Unterschiede in der Lage ihrer Elemente miteinander verglichen werden können. Der Test setzt keine Normalverteilung der Daten voraus und zählt damit zu den nichtparametrischen Verfahren. Er ist vergleichsweise einfach durchführbar und eignet sich damit insbesondere für eine schnelle Abschätzung. Benannt ist der Test nach John W. Tukey, der ihn 1959 beschrieb.[1]
Voraussetzungen und Hypothesen
Die beiden zu untersuchenden Stichproben, deren Elemente mindestens ordinalskaliert vorliegen, müssen unabhängig voneinander und zufällig erhoben worden sein sowie jeweils mindestens fünf Elemente enthalten (). Darüber hinaus sollte der Umfang beider Stichproben nicht zu stark voneinander abweichen, Tukey gibt diesbezüglich ein Verhältnis der größeren zur kleineren Stichprobe von weniger als 1,33 an. Die Häufigkeitsverteilungen beider Stichproben sollten vergleichbar sein. Als Nullhypothese des Tests wird angenommen, dass sich beide Stichproben hinsichtlich der Lage ihrer Elemente nicht unterscheiden. Die Alternativhypothese geht von einem Unterschied in der Lage aus.
Durchführung
Für die Durchführung des Tests werden zunächst die Elemente beider Stichproben gemeinsam sortiert, ihre Zugehörigkeit zu einer der beiden Stichproben bleibt dabei erhalten. Anschließend wird überprüft, ob beide Stichproben gegeneinander verschoben sind und damit eine Stichprobe den höchsten und die andere den niedrigsten aller Werte enthält. Sollte dies nicht der Fall sein, sich der höchste und der niedrigste aller Werte also in der gleichen Stichprobe befinden, ist der Test nicht anwendbar.
An den Enden der sortierten Gesamtheit der Elemente beider Stichproben wird dann jeweils die Zahl der Elemente bestimmt, um welche die beiden Stichproben verschoben sind. Es werden also zum einen die Elemente gezählt, die in der Stichprobe mit dem kleinsten gemeinsamen Element kleiner sind als das kleinste Element der anderen Stichprobe, und zum anderen die Elemente, die in der Stichprobe mit dem größten gemeinsamen Element größer sind als das größte Element der anderen Stichprobe. Identische Werte in beiden Stichproben, die am Anfang des jeweiligen verschobenen Endes liegen, werden mit 0,5 gezählt.
Die Summe dieser beiden Zahlen ist die Teststatistik , für diese gilt näherungsweise:
- bei ist die Nullhypothese beizubehalten
- bei ist die Nullhypothese zum Signifikanzniveau zu verwerfen
- bei ist die Nullhypothese zum Signifikanzniveau zu verwerfen
- bei ist die Nullhypothese zum Signifikanzniveau zu verwerfen
Für Stichproben, bei denen das Verhältnis der Stichprobenumfänge den Wert von 1,33 übersteigt, schlug Tukey einen Korrekturwert vor, der aus den Stichprobenumfängen berechnet und von der Teststatistik subtrahiert wird.
In einer von Neave veröffentlichten Weiterentwicklung des Tests wird, bei sonst gleicher Testdurchführung, derjenige Einzelwert der kombinierten Elemente beider Stichproben ausgelassen, dessen Nichtberücksichtigung die Teststatistik maximiert. Für die auf diese Weise modifizierte Teststatistik gilt näherungsweise:
- bei ist die Nullhypothese zu akzeptieren
- bei ist die Nullhypothese zum Signifikanzniveau zu verwerfen
- bei ist die Nullhypothese zum Signifikanzniveau zu verwerfen
- bei ist die Nullhypothese zum Signifikanzniveau zu verwerfen
Historische Informationen
John Tukey veröffentlichte den von ihm entwickelten Test 1959 als Reaktion auf eine Herausforderung, die Walter Eric Duckworth drei Jahre zuvor während einer Tagung der Royal Statistical Society formuliert hatte.[2] Henry R. Neave beschrieb 1966 eine Modifikation des Tests,[3] der in dieser Form auch als Tukey-Neave-Test bezeichnet wird. Zwei Jahre später untersuchte er außerdem gemeinsam mit Clive W. J. Granger durch Monte-Carlo-Simulationen die Teststärke des Tests in der Originalfassung und der modifizierten Version im Vergleich zu anderen Zwei-Stichproben-Tests.[4] William P. Dunlap und Kollegen führten in den 1990er Jahren weiterführende Poweranalysen mit größeren Stichprobenumfängen durch.[5] Zu den von Tukey veröffentlichten Tabellen mit kritischen Werten zur exakten Bestimmung des Signifikanzniveaus wurden später korrigierte und erweiterte Fassungen veröffentlicht.[6] Wilfred Westlake beschrieb außerdem 1971 einen Test, der als einseitige Version des Schnelltests nach Tukey angesehen werden kann.[7]
Alternative Verfahren
Der Test der Wahl zum Vergleich von zwei unabhängigen Stichproben ist beim Vorliegen normalverteilter Daten der Zweistichproben-t-Test. Bei nicht normalverteilten Daten kommen als nicht-parametrische Verfahren der Wilcoxon-Mann-Whitney-Test und der Median-Test in Betracht. Der Vorteil des Schnelltests nach Tukey im Vergleich zu diesen Tests ist die einfache Durchführung, die auch ohne Computer oder Taschenrechner und bei moderaten Stichprobengrößen gegebenenfalls durch Kopfrechnen möglich ist.
Einzelnachweise
- ↑ John W. Tukey: A Quick, Compact, Two-Sample Test to Duckworth's Specifications. In: Technometrics. 1(1)/1959, S. 31–48, doi:10.1080/00401706.1959.10489847 JSTOR:1266308
- ↑ Steve Selvin: A Biostatistics Toolbox for Data Analysis. Cambridge University Press, Cambridge 2015, ISBN 1-10-711308-3, S. 300
- ↑ Henry R. Neave: A Development of Tukey's Quick Test of Location. In: Journal of the American Statistical Association. 61(316)/1966, S. 949–964, doi:10.1080/01621459.1966.10482186 JSTOR:2283191
- ↑ Henry R. Neave, Clive W. J. Granger: A Monte Carlo Study Comparing Various Two-Sample Tests for Differences in Mean. In: Technometrics. 10(3)/1968, S. 509–522, doi:10.1080/00401706.1968.10490598 JSTOR:1267105
- ↑ William P. Dunlap, Tammy Greer, Gregory O. Beatty: A Monte-Carlo Study of Type I Error Rates and Power for Tukey's Pocket Test. In: Journal of General Psychology. 123(4)/1996, S. 333–339, doi:10.1080/00221309.1996.9921285
- ↑ Daniel J. Gans: Corrected and Extended Tables for Tukey's Quick Test. In: Technometrics. 23(2)/1981, S. 193–195, doi:10.1080/00401706.1981.10486265 JSTOR:1268038
- ↑ W. J. Westlake: A One-Sided Version of the Tukey-Duckworth Test. In: Technometrics. 13(4)/1971, S. 901–903, doi:10.1080/00401706.1971.10488864 JSTOR:1266969