Permutationstest

Ein Permutationstest ist in der nichtparametrischen Statistik ein exakter Test, bei dem zufällige Stichprobenwiederholungen unter Annahme der Nullhypothese identischer Verteilungen gezogen werden, häufig mithilfe von Monte-Carlo-Simulationen. Basierend auf der daraus resultierenden Verteilung der Teststatistik wird bestimmt, wie wahrscheinlich die Teststatistik der Originaldaten unter der Nullhypothese ist.

Methode

Animation eines Permutationstests. Die 4 Stichproben in rot sind einer Normalverteilung entnommen und die 5 Stichproben in blau sind einer anderen Normalverteilung entnommen. Die Hypothese ist, dass die roten Stichproben einer Verteilung mit größerem Mittelwert entstammen; die Nullhypothese ist, dass beide Stichproben der gleichen Verteilung entstammen. Die originale Teststatistik ist in pink dargestellt, die Teststatistiken der Kombinationen werden in das Histogramm eingetragen. Der geschätzte p-Wert ist der Anteil der Kombinationen, der einen gleichen oder größeren Wert der Teststatistik liefert als die original vorliegende Teststatistik.

Mithilfe von Permutationstests kann beispielsweise untersucht werden, ob zwei Stichproben aus unterschiedlichen Verteilungen stammen (beispielsweise kann man die Differenz der Mittelwerte als Teststatistik auswerten). Die Nullhypothese ist, dass beide Stichproben der gleichen Verteilung entstammen (und die Differenz der Mittelwerte den Wert 0 annimmt). Gilt die Nullhypothese, dann können Datenpunkte von der einen Stichprobe in die andere getauscht werden (Permutation). Man erhält durch Permutieren Stichprobenwiederholungen und kann dann die entsprechende Teststatistik wiederholt berechnen und deren empirische Verteilung bestimmen. Aus dieser Verteilung leitet sich direkt der p-Wert der auf den beiden ursprünglichen Stichproben vorliegenden Teststatistik ab[1]. Die Zahl der möglichen (sich nicht wiederholenden) Permutationen ist , wobei die jeweiligen Stichprobenumfänge sind. Da schnell sehr groß wird, beschränkt man sich typischerweise auf eine Monte-Carlo-Simulation, welche eine bestimmte Zahl zufälliger Permutationen zieht (vgl. auch Fisher-Yates-Algorithmus zur Implementierung).

Die Zahl der nötigen Permutationen kann durch Stoppregeln bestimmt werden[2].

Ein Beispiel für einen Permutationstest zur Varianzanalyse ist PERMANOVA.

Gepaarte Stichproben

Für gepaarte Stichproben ist der gepaarte Permutationstest geeignet, welcher die Paarungsstruktur beibehält und lediglich innerhalb der jeweiligen Paare permutiert. Daneben ist der Bootstraptest (neben dem nichtparametrischen Wilcoxon-Vorzeichen-Rang-Test) geeignet um bei gepaarten Stichproben zu überprüfen ob der Mittelwert der Differenzen statistisch signifikant von Null verschieden ist.

Begriffliche Abgrenzung

Randomisierte Tests (welche auf einer zufälligen Zuweisung des Testergebnisses beruhen) sind nicht zu verwechseln mit Permutationstests (welche auf zufälligen Stichprobenwiederholungen basieren)[3]. Historisch wurden Permutationstests gelegentlich als randomisierte Tests bezeichnet.

Alternativen

Bootstrap-basierte Tests nehmen nicht zwangsläufig die Nullhypothese an (obwohl es möglich ist).

Literatur

Einzelnachweise

  1. Permutation Test: Visual Explanation. Abgerufen am 21. September 2021.
  2. Axel Gandy: Sequential Implementation of Monte Carlo Tests With Uniformly Bounded Resampling Risk. In: Journal of the American Statistical Association. Band 104, Nr. 488, Dezember 2009, ISSN 0162-1459, S. 1504–1511, doi:10.1198/jasa.2009.tm08368.
  3. Patrick Onghena: Randomization Tests or Permutation Tests? A Historical and Terminological Clarification. In: Randomization, Masking, and Allocation Concealment. 1. Auflage. Chapman and Hall/CRC, Boca Raton 2017, ISBN 978-1-315-30511-0, S. 209–228, doi:10.1201/9781315305110-14 (taylorfrancis.com).

Auf dieser Seite verwendete Medien

Permutation test example animation.gif
Autor/Urheber: Dicklyon, Lizenz: CC BY-SA 4.0
Animation of a permutation test being computed on sets of 4 and 5 random values. The 4 values in red are drawn from one distribution, and the 5 values in blue from another, and the hypothesis is that the mean of the first four is higher than the mean of the 5; the null hypothesisis is that they are the same. There are 126 distinct ways to put 4 values into one group and 5 into another (9-choose-4 or 9-choose-5). Of these, one is per the original labeling, and the other 125 are "permutations" that generate the histogram of mean differences shown. The p-value of the hypothesis is estimated as the proportion of permutations that give a difference as large or larger than the difference of means of the labeled sets. In this example, the p-value estimate is approximate, due to the finite bin width of the histogram. The animation was created in Matlab from very hacky code. The underlying distributions of the sets are normal with means 60 and 50, and standard deviations of 10.