Bonferroni-Korrektur
Die Bonferroni-Korrektur ist ein Verfahren der mathematischen Statistik zur Adjustierung der Signifikanzniveaus der Einzeltests bei multiplen Testen, um der Alphafehler-Kumulierung entgegenzuwirken und für die Durchschnittshypothese ein vorgegebenes Signifikanzniveau einzuhalten. Die Adjustierung vermindert die Signifikanzniveaus der Einzeltests und damit tendenziell die Anzahl der Ablehnungen richtiger Nullhypothesen (falsch-positiver Befunde in biometrischer Terminologie), so dass die verbleibenden Ablehnungen von Nullhypothesen mit einer höheren statistischen Signifikanz verbunden sind. Die Bonferroni-Methode (nach Carlo Emilio Bonferroni) umfasst neben der Bonferroni-Korrektur ein ähnliches Vorgehen zur Anpassung der Konfidenzniveaus bei der Konstruktion simultaner Konfidenzintervalle für einen mehrdimensionalen Parametervektor.
Adjustierte Signifikanzniveaus
Zu statistischen Tests mit den Nullhypothesen kann die Durchschnittshypothese gebildet werden. Die Hypothesen heißen in diesem Zusammenhang Elementarhypothesen und heißt Globalhypothese. Ein Test für die Nullhypothese kann auf den Tests für die einzelnen Elementarhypothesen aufgebaut werden, da die Nullhypothese genau dann falsch ist, wenn mindestens eine der Elementarhypothesen falsch ist. Eine mögliche Testprozedur besteht also darin, genau dann abzulehnen, wenn mindestens eine der Hypothesen abgelehnt wird. Ein vorgegebenes globales Signifikanzniveau für den Test von kann im Allgemeinen nicht eingehalten werden, wenn dieses als Signifikanzniveau für jeden der Einzeltests verwendet wird, da es dann zur so genannten Alphafehler-Kumulierung kommen kann.
Um das gewünschte globale Signifikanzniveau für den Test der Globalhypothese einzuhalten, besteht die Bonferroni-Korrektur darin, für die einzelnen Tests das lokale Signifikanzniveau
vorzugeben. Die so angepassten Signifikanzniveaus
für die Einzeltests werden auch adjustierte Signifikanzniveaus genannt. Die Verwendung der adjustierten Signifikanzniveaus führt dazu, das für den Test der Globalhypothese das Signifikanzniveau gültig ist.
Adjustierte p-Werte
Bei einer klassischen Testdurchführung erfolgt die Ablehnung einer Nullhypothese, falls eine Teststatistik im Ablehnbereich (kritischen Bereich) liegt, der vom vorgegebenen Signifikanzniveau abhängt. Bei einer -Wert-basierten Testdurchführung, die typisch für die Anwendung statistischer Software ist, wird ein berechneter -Wert mit dem vorgegebenen Signifikanzniveau verglichen und die Nullhypothese wird abgelehnt, falls der -Wert kleiner als das vorgegebene Signifikanzniveau ist.
Bei einer -Wert-basierten Testdurchführung wird die Bonferroni-Korrektur durchgeführt, indem die -Werte der Einzeltests mit den adjustierten Signifikanzniveaus verglichen werden, dabei wird die -te Nullhypothese abgelehnt, falls gilt.
Alternativ können adjustierte -Werte
für die Einzeltests gebildet werden, die um den Faktor größer sind als die ursprünglichen -Werte, und diese mit dem globalen Signifikanzniveau verglichen werden. Die -te Nullhypothese wird abgelehnt, falls gilt.
Beide Vorgehensweisen führen zu denselben Testentscheidungen, da die beiden Regeln und äquivalent sind.
Beispiel
Gegeben seien die p-Werte dreier Hypothesentests, die eine Hypothesenfamilie bilden. Unter Vernachlässigung der multiplen Testung und alleiniger Betrachtung lokaler Signifikanzniveaus erfolgt die Ablehnung der Nullhypothesen 1 und 2, da und , während die dritte Hypothese nicht abgelehnt wird, da . Berücksichtigt man jedoch die Bonferroni-Korrektur (mit ), so erfolgt nur noch die Ablehnung der Nullhypothese 1, da und .
Theoretischer Hintergrund
Die Globalhypothese wird genau dann abgelehnt, wenn mindestens eine Elementarhypothesen abgelehnt wird. Das Ereignis kann als Vereinigung der Ereignisse für dargestellt werden. Mit der ersten Bonferroni-Ungleichung, die auch Boolesche Ungleichung heißt, ergibt sich die Ungleichung
Betrachtet man den Fall, dass richtig ist, und damit auch die Hypothesen richtig sind, und beschränkt für diesen Fall die Wahrscheinlichkeiten , die dann Fehlerwahrscheinlichkeiten 1. Art sind, jeweils durch das lokale Signifikanzniveau nach oben, so ist durch
nach oben beschränkt.
Die Bonferroni-Korrektur kann sehr konservativ sein. Deshalb wurden genauere Methoden entwickelt, die den -Fehler weniger konservativ kontrollieren und das Signifikanzniveau der multiplen Testprozedur weiter ausschöpfen (siehe Alphafehler-Kumulierung). Im Vergleich zur allgemein anwendbaren Bonferroni-Methode ergibt sich, allerdings nur unter einschränkenden Voraussetzungen, mit der Šidák-Korrektur ein verbessertes Verfahren.
Literatur
- H. Abdi: Encyclopedia of Measurement and Statistics. Hrsg.: N. J. Salkind. Sage, Thousand Oaks, CA 2007, Bonferroni and Sidak corrections for multiple comparisons (utdallas.edu [PDF]).
Weblinks
- Perneger, Thomas V, What's wrong with Bonferroni adjustments, BMJ 1998;316:1236-1238 (18. April).
- Eric W. Weisstein: Bonferroni Correction. In: MathWorld (englisch).
- School of Psychology, University of New England, New South Wales, Australia, 2000.
- Manitoba Centre for Health Policy (MCHP) 2003, Concept: Multiple Comparisons.