Hypothese (Statistik)

In der Statistik bezeichnet man mit Hypothese eine Annahme, die mit Methoden der mathematischen Statistik auf Basis empirischer Daten geprüft wird. Man unterscheidet als Gegensatzpaar Nullhypothese und Alternativhypothese (auch Gegenhypothese oder Arbeitshypothese).

Häufig sagt die Nullhypothese aus, dass kein Effekt bzw. Unterschied vorliegt oder dass ein bestimmter Zusammenhang nicht besteht. Diese These soll verworfen werden, so dass die Alternativhypothese als Möglichkeit übrig bleibt. Durch dieses indirekte Vorgehen soll die Wahrscheinlichkeit für eine irrtümliche Verwerfung der Nullhypothese kontrolliert klein bleiben. Oft entsteht jedoch Verwirrung beim Anwender, weil dieses Vorgehen die Möglichkeit nahelegt, dass – sofern die Nullhypothese nicht verworfen und die Alternativhypothese damit nicht angenommen werden kann – die Nullhypothese als erwiesen gilt. Dies ist allerdings nicht der Fall. Ein allgemeiner Ansatz stellt das Testen sogenannter allgemeiner linearer Hypothesen im klassischen linearen Modell der Normalregression dar.

Nullhypothese

In der Statistik ist die Nullhypothese eine Annahme über die Wahrscheinlichkeitsverteilung einer oder mehrerer Zufallsvariablen. Die Alternativhypothese steht für eine Menge von alternativen Annahmen bezüglich der Nullhypothese. Die Aufgabe, zwischen Null- und Alternativhypothese zu entscheiden, wird als Testproblem bezeichnet. Spricht das Stichprobenergebnis gegen die Annahme, so wird die Hypothese abgelehnt; andernfalls wird sie beibehalten.

Weil eine Untersuchung häufig das Ziel hat, zu zeigen, dass es einen bestimmten Unterschied gibt, der in der alternativen Hypothese formuliert wird, beinhaltet die Nullhypothese das Gegenteil, also die Gleichheit von Sachverhalten, etwa:

  • dass zwischen Gruppen kein Unterschied besteht,
  • dass ein bestimmtes Medikament keine Wirkung zeigt,
  • dass zwischen Merkmalen kein Zusammenhang besteht.

Beispiele

Statistik

Weil man den Verdacht hat, es gäbe einen prinzipiellen Unterschied zwischen Männern und Frauen in Bezug zu einem bestimmten Testergebnis, macht man vorerst die Annahme, es gäbe keinen Unterschied. Diese Annahme ist die Nullhypothese. Man versucht die Frage zu beantworten, ob sich das Testergebnis zwischen den Gruppen statistisch signifikant unterscheidet. Die Nullhypothese wäre in diesem Fall, dass die Durchschnittsergebnisse von Männern und Frauen gleich sind:

wobei:

die Nullhypothese ist,
der Erwartungswert des Testergebnisses der Männer, und
der Erwartungswert des Testergebnisses der Frauen

Psychologie

Im Bereich der forensischen Psychologie ist die Nullhypothese durch das Urteil des Bundesgerichtshofes (zum Verfahren bei einer Glaubhaftigkeitsbegutachtung)[1] definiert worden: „Das methodische Grundprinzip besteht darin, einen zu überprüfenden Sachverhalt (hier: Glaubhaftigkeit der spezifischen Aussage) so lange zu negieren, bis diese Negation mit den gesammelten Fakten nicht mehr vereinbar ist. Der Sachverständige nimmt daher bei der Begutachtung zunächst an, die Aussage sei unwahr (sog. Nullhypothese). Zur Prüfung dieser Annahme hat er weitere Hypothesen zu bilden. Ergibt seine Prüfstrategie, dass die Unwahrhypothese mit den erhobenen Fakten nicht mehr in Übereinstimmung stehen kann, so wird sie verworfen, und es gilt dann die Alternativhypothese, dass es sich um eine wahre Aussage handelt.“ (vergleiche auch In dubio pro reo)

Alternativhypothese

Als Alternativhypothese oder bezeichnet man in der empirischen Wissenschaft häufig eine durch Beobachtungen oder Überlegungen begründete Annahme oder Vermutung, die zur Erklärung bestimmter Phänomene dient und die einer möglicherweise verbreiteten Annahme oder Vermutung (nämlich der Nullhypothese) entgegensteht. Insofern kann die Alternativhypothese als innovativ betrachtet werden.

Demgegenüber steht die Nullhypothese. Null- und Alternativhypothese dürfen sich nicht überschneiden, d. h., sie müssen disjunkt sein.[2] Ziel eines statistischen Tests ist die Ablehnung (Verwerfung) der Nullhypothese. Falls diese nicht verworfen werden kann (z. B. weil nicht genügend Beobachtungen vorhanden sind), besteht aus statistischer Sicht allerdings kein Grund, davon auszugehen, dass die Gültigkeit der Nullhypothese belegt werden konnte (vgl. Fehler 2. Art). Ein statistischer Test kann also lediglich zu einer Annahme der Alternativhypothese durch eine Verwerfung der Nullhypothese, nicht aber zu einer (im engeren Sinne) Annahme der Nullhypothese führen. Allerdings bedeutet das nicht, dass eine getestete Nullhypothese nicht auch korrekt sein kann. Ein wiederholtes Scheitern, eine Nullhypothese zu widerlegen, bedeutet dann, dass die in der Nullhypothese zu testende Annahme zusätzliche Stützung erhält.

Arten von Hypothesen

Gerichtet vs. ungerichtet

Wenn die Gesamtheit aller Möglichkeiten ist, dann kann man einen Test allgemein so formulieren, dass die Teilmenge die Nullhypothese darstellt und die Alternativhypothese. Für diesen allgemeinen Fall gibt es allerdings keine Standardtests. Stattdessen schaut man sich die Spezialfälle an, wo entweder nur die Menge, die die Nullhypothese erfüllt, ein Intervall ist (ungerichteter Test) oder wo beide Hypothesen durch ein Intervall dargestellt werden können (gerichteter Test).

  • Ungerichtete Alternativhypothesen unterstellen lediglich einen Unterschied zwischen den verglichenen Kennwerten. Dabei ist egal, ob dieser Unterschied nun nach oben oder nach unten gerichtet ist. Zum Beispiel: Ein Training werde mit Kindern durchgeführt. Wenn die Hypothese ungerichtet ist, dann könnte die Alternativhypothese lauten, dass es einen Unterschied in der sportlichen Leistungsfähigkeit zwischen der Population der Kinder ohne und der mit Training gibt. Dabei ist es egal, ob die Kinder mit Training über eine höhere oder niedrigere sportliche Leistungsfähigkeit als Kinder ohne Training verfügen. Entsprechend lautet die Nullhypothese, dass keine Unterschiede zwischen beiden Populationen bestehen.
  • Gerichtete Hypothesen unterstellen einen Unterschied zwischen den untersuchten Kennwerten in eine bestimmte Richtung. Im obigen Beispiel lautete die Alternativhypothese dann entweder, dass die Kinder mit Training über eine höhere oder niedrigere sportliche Leistungsfähigkeit als Kinder ohne Training verfügen. Die Nullhypothese lautet dann entsprechend, dass beide Populationen entweder gleich sind oder einen Unterschied in die entgegengesetzte Richtung aufweisen.

Spezifisch vs. unspezifisch

  • Spezifische Hypothesen machen Aussagen über die Größe des erwarteten Unterschieds oder Zusammenhangs zwischen den untersuchten Kennwerten (postulieren z. B. einen bestimmten Mindestwert). Bezogen auf obiges Beispiel könnte man z. B. unterstellen, dass die Trainingspopulation um mindestens drei IQ-Punkte besser ist als die Ausgangspopulation.
  • Unspezifische Hypothesen machen hingegen keine Aussagen über die Größe des erwarteten Unterschieds bzw. Zusammenhangs.

Einfach vs. zusammengesetzt

  • Eine Hypothese heißt einfach, wenn ihr eine einzelne Verteilung zu Grunde liegt. Macht die Hypothese lediglich die Aussage, dass die Verteilung einer Familie von Verteilungen angehört, spricht man von zusammengesetzten Hypothesen. Eine Nullhypothese der Form bei normalverteilten Größen mit bekannter Varianz ist ein Beispiel für eine einfache Hypothese, die dazugehörige Alternativhypothese ist zusammengesetzt.

Wahl der Null- und Alternativhypothese

Formal zerlegen die Null- und Alternativhypothese einen Parameterraum in zwei disjunkte nicht leere Teilmengen und . Die Nullhypothese beinhaltet die Aussage, dass der unbekannte Parameter aus stammt, und die Alternativhypothese, dass der unbekannte Parameter aus stammt.

vs.

Für zwei Tests, den Einstichproben-t-Test (Parametertest) und den Lilliefors-Test (Verteilungstest), zeigt die folgende Tabelle die möglichen Null- und Alternativhypothesen usw. auf.

TestNullhypotheseAlternativ-
hypothese
Parameterraum
Einstichproben t-Test (*) mit
mit mit
mit mit
Lilliefors-Test ist normalverteilt (*) ist nicht normalverteiltAlle VerteilungenNormalverteilungalle Verteilungen außer der Normalverteilung

Bei den beiden mit (*) markierten Nullhypothesen handelt es sich um einfache Nullhypothesen. In diesem Fall kann die Rolle der Nullhypothese und der Alternativhypothese nicht vertauscht werden, selbst wenn es aus der Anwendungssicht wünschenswert wäre.

Nur im Fall der beiden anderen zusammengesetzten Nullhypothesen kann die Rolle der Null- und Alternativhypothese vertauscht werden, d. h. man muss eines der Hypothesenpaare auswählen. Jedoch gilt hier immer, dass das Gleichheitszeichen in der Nullhypothese stehen muss.

Bei der Testentscheidung kann bei Nichtablehnung der Nullhypothese der Fehler 2. Art unterlaufen (Nichtablehnung der Nullhypothese, obwohl die Alternativhypothese gilt). Die Wahrscheinlichkeit dafür ist jedoch unbekannt. Bei Ablehnung der Nullhypothese kann zwar der Fehler 1. Art (Ablehnung der Nullhypothese, obwohl die Nullhypothese gilt) unterlaufen, jedoch ist die Wahrscheinlichkeit dafür kleiner gleich dem vorgegebenen Signifikanzniveau (in der Regel 5 %). Daher ist man daran interessiert, die Nullhypothese abzulehnen.

Dies führt zu dem folgenden Entscheidungsschema in 4 Schritten:[3]

  1. Geht aus der Aufgabenstellung hervor, ob etwas gezeigt oder widerlegt werden soll?
    Ja: Man formuliert als Alternativhypothese das, was gezeigt, bzw. als Nullhypothese das, was widerlegt werden soll.
    Nein: Sind die Konsequenzen von Fehlentscheidungen bekannt?
    Ja: Man macht den Fehler mit dem größten Risiko zum Fehler 1. Art, da dieser Fehler festgelegt wird.
  2. Nein: Geht aus der Aufgabenstellung hervor, zu welcher Interessensgruppe der Prüfer gehört?
    Ja: Man formuliert die Alternativhypothese so, dass es im Interesse des Prüfers liegt, die Alternativhypothese nachzuweisen.
  3. Nein: Dann ist eine eindeutige Hypothesenformulierung nicht möglich.

Beispiel zu 1.: Eine Gruppe von Umweltschützern und eine Waschmittelfirma streiten sich, ob der mittlere Phosphatgehalt in einem Waschmittel zu hoch ist (z. B. 18 g pro Packung).

  • Die Umweltschützer wollen beweisen, dass der Phosphatgehalt zu hoch ist. Daher werden ihre Hypothesen lauten: vs. .
  • Die Firma will beweisen, dass der Phosphatgehalt in Ordnung ist. Daher werden ihre Hypothesen lauten: vs. .

Je nach Interessenlage kommt man also zu unterschiedlichen Hypothesenpaaren.

Beispiel zu 2.: Ein Bankkunde will einen Kredit von 1.000 Euro von seiner Bank. Lehnt der Bankier den Kreditwunsch ab und ist der Kunde solvent, so verliert er die gezahlten Zinsen in Höhe von 80 Euro. Gibt der Bankier dem Kunden den Kredit und der Kunde ist insolvent, so verliert der Bankier die gesamten 1.000 Euro.

  • Werden die Hypothesen mit einem Signifikanzniveau von 5 % so formuliert, dass der Fehler 1. Art gerade Bankier lehnt den Kreditwunsch ab und der Kunde ist solvent entspricht, so ist bekannt, dass der erwartete Verlust beim Fehler 1. Art gleich 80 Euro × 5 % = 4 Euro ist. Beim Fehler 2. Art ist die Wahrscheinlichkeit unbekannt, d. h., im ungünstigsten Fall ist er Eins und der maximale Verlust ist gleich 1.000 Euro. Zusammen ergibt sich bei einer Fehlentscheidung im Test ein erwarteter Verlust von 1.004 Euro.
  • Werden die Hypothesen mit einem Signifikanzniveau von 5 % so formuliert, dass der Fehler 1. Art gerade Bankier akzeptiert den Kreditwunsch und der Kunde ist insolvent entspricht, so ist bekannt, dass der erwartete Verlust beim Fehler 1. Art gleich 1.000 Euro × 5 % = 50 Euro ist. Beim Fehler 2. Art ist die Wahrscheinlichkeit unbekannt, d. h. im ungünstigsten Fall ist er Eins und der maximale Verlust ist gleich 80 Euro. Zusammen ergibt sich bei einer Fehlentscheidung im Test ein erwarteter Verlust von 130 Euro.

Die Hypothesen sollten also so gewählt werden, dass der Fehler 1. Art Bankier akzeptiert den Kreditwunsch und der Kunde ist insolvent entspricht, da dann der erwartete Verlust am geringsten ist.

Einzelnachweise

  1. BGH, Urteil vom 30. Juli 1999, Az. 1 StR 618/98, Volltext = BGHSt 45, 164 ff.
  2. George G. Judge, R. Carter Hill, W. Griffiths, Helmut Lütkepohl, T. C. Lee. Introduction to the Theory and Practice of Econometrics. 2. Auflage. John Wiley & Sons, New York/ Chichester/ Brisbane/ Toronto/ Singapore 1988, ISBN 0-471-62414-4, S. 93
  3. H. Rinne: Taschenbuch der Statistik. 2. Auflage. Harri Deutsch Verlag, Frankfurt am Main 1997, ISBN 3-8171-1559-8, S. 528.