Gauß-Test

Der Gauß-Test oder Z-Test ist in der mathematischen Statistik eine Gruppe von Hypothesentests mit standardnormalverteilter Testprüfgröße unter der Nullhypothese. Der Test ist benannt nach Carl Friedrich Gauß.

Mit dem Gauß-Test werden anhand von Stichproben-Mittelwerten Hypothesen über die Erwartungswerte derjenigen Grundgesamtheiten geprüft, aus denen die Stichproben stammen.

Der Gauß-Test folgt einer ähnlichen Methode wie der t-Test. Der wichtigste Unterschied liegt in den Voraussetzungen für die Anwendung dieser Tests: Während der t-Test mit den empirischen Standardabweichungen der Stichproben arbeitet, müssen für den Gauß-Test die Standardabweichungen der Grundgesamtheiten bekannt sein. Des Weiteren verwendet der Gauß-Test grundsätzlich die Standardnormalverteilung als Kennwerteverteilung, während der t-Test auf die t-Verteilung zurückgreift. Somit ist der Gauß-Test für kleine Stichproben nur bedingt geeignet.

Mathematische Grundlagen

Sind unabhängige normalverteilte Zufallsvariablen mit Erwartungswert und Standardabweichung , so ist ihr arithmetisches Mittel

normalverteilt mit Erwartungswert und Standardabweichung .

Die Stichprobenfunktion

ist dann unter der Nullhypothese standardnormalverteilt und wird als Teststatistik verwendet.

Die Teststatistik kann geschrieben werden als:

,

also wie eine standardnormalverteilte Zufallsvariable plus eine Zahl, die auf standardisierte Weise die Distanz zwischen dem wirklichen und dem unterstellten Erwartungswert zeigt.

Liegen außerdem unabhängige normalverteilte Zufallsvariablen mit Erwartungswert , Standardabweichung und arithmetischem Mittel

vor, die zusätzlich unabhängig von der -Stichprobe sind, so ist normalverteilt mit Erwartungswert und Standardabweichung .

Die Stichprobenfunktion

ist dann unter der Nullhypothese standardnormalverteilt und wird als Teststatistik verwendet.

Einstichproben-Gauß-Test

Anwendung

Der Einstichproben-Gauß-Test prüft anhand des arithmetischen Mittels einer Stichprobe, ob der Erwartungswert der zugehörigen Grundgesamtheit ungleich (bzw. kleiner oder größer) einem vorgegebenen Wert ist.

Die Stichprobe bestehe aus den Ausprägungen unabhängiger Zufallsvariablen und entstamme einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert und bekannter Standardabweichung .

Es werden getestet bei einem

  • zweiseitigen Test: gegen
  • rechtsseitigen Test: gegen
  • linksseitigen Test: gegen

Der Wert von wird vom Anwender vorgegeben.

Berechnung der Testprüfgröße

Mit dem Stichprobenmittelwert berechnet man die Testprüfgröße .

Zweistichproben-Gauß-Test für unabhängige Stichproben

Anwendung

Der Zweistichproben-Gauß-Test für unabhängige Stichproben prüft anhand der arithmetischen Mittel der Stichproben, ob die Erwartungswerte der zugehörigen Grundgesamtheiten verschieden sind.

Die unabhängigen Stichproben und sollen auch untereinander unabhängig sein und normalverteilten Grundgesamtheiten mit unbekannten Erwartungswerten bzw. und bekannten Standardabweichungen bzw. entstammen.

Es werden getestet bei einem

  • zweiseitigen Test: gegen
  • rechtsseitigen Test: gegen
  • linksseitigen Test: gegen

Der Wert von wird vom Anwender vorgegeben.

Berechnung der Testprüfgröße

Mit den Stichprobenmittelwerten und berechnet man die Testprüfgröße .

Zweistichproben-Gauß-Test für abhängige (verbundene) Stichproben

Anwendung

Für den Zweistichproben-Gauß-Test für abhängige Stichproben müssen Paare von Messwerten vorliegen, wie man sie z. B. bei Vorher-Nachher-Messungen vorfindet. Mittels der Paardifferenzen wird geprüft, ob für diese Differenzen der Erwartungswert der zugehörigen Grundgesamtheit ungleich (bzw. kleiner oder größer) einem vorgegebenen Wert ist.

Die Differenzen sollen einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert und bekannter Standardabweichung entstammen.

Es werden getestet bei einem

  • zweiseitigen Test: gegen
  • rechtsseitigen Test: gegen
  • linksseitigen Test: gegen

wird vom Anwender vorgegeben. In den meisten Anwendungsfällen wird auf „Ungleichheit“ () getestet, dann ist .

Berechnung der Testprüfgröße

Die Differenzen bilden eine neue Stichprobe mit arithmetischem Mittel . Also kann man den Einstichproben-Gauß-Test auf die Stichprobe der Differenzen anwenden und erhält als Testprüfgröße .

Entscheidung über die Hypothesen

Bei allen drei Gauß-Tests werden für die Entscheidung über die Annahme bzw. Verwerfung der Hypothesen die allgemeinen Kriterien für Hypothesentests angewendet. Da unter der Nullhypothese eine standardnormalverteilte Zufallsvariable ist, erhält man die folgenden Regeln.

Ablehnung von (d. h. Annahme von ) zum Signifikanzniveau , falls gilt:

  • beim zweiseitigen Test: (dies ist das -Quantil der Standardnormalverteilung)
  • beim rechtsseitigen Test:
  • beim linksseitigen Test:

Gauß-Test für nicht-normalverteilte Zufallsvariablen

Für große Stichprobenumfänge (> 30 als Faustregel) kann aufgrund des Zentralen Grenzwertsatzes auf die Normalverteilungsannahme verzichtet werden. Wenn also die für den Gauß-Test geltenden Forderungen an die Erwartungswerte und Standardabweichungen der beteiligten Zufallsvariablen erfüllt sind, geht man davon aus, dass die für die Berechnung von z erforderlichen Summen approximativ normalverteilt sind und der Gauß-Test in guter Näherung korrekte Ergebnisse liefert.

Beispiel

Ein bestimmter Blutparameter B ist in der Bevölkerung in sehr guter Näherung normalverteilt mit . Von einer Gruppe chemisch verwandter Pharmaka ist bekannt, dass sie die Verteilung des Blutparameters verschieben können, d. h. sie verändern möglicherweise den Erwartungswert (unter Beibehaltung der Verteilungsform).

Für ein Pharmakon P aus dieser Gruppe soll geprüft werden, ob sich eine solche Veränderung tatsächlich einstellt. Zufällige unabhängige Stichproben des Umfangs n=22 ergeben die folgenden Messwerte für B:

ohne Gabe von P   xi  12 13 10 12 14 11 14 18 15 13 15 13 11 17 11 12 13 14 15 13 14 13
mit Gabe von P    yi  13 14 13 17 13 16 16 19 17 15 17 15 15 20 15 15 14 15 13 15 16 15

Mit diesen Messwerten sollen verschiedene Hypothesen geprüft werden. Das Signifikanzniveau soll jeweils 0,05 betragen; die zugehörigen u-Werte sind dann (im Folgenden alle Werte gerundet):

Für die Mittelwerte berechnet man und .

  • 1. Hypothese: Die Werte von B liegen nach Verabreichung von P im Mittel oberhalb von 15.
Verfahren: rechtsseitiger Einstichproben-Gauß-Test
und
Entscheidung: H0 wird beibehalten. Es ließ sich nicht nachweisen, dass die Gabe von P zu einem durchschnittlichen B-Wert oberhalb 15 führt.
  • 2. Hypothese: Die Werte von B unterscheiden sich im Mittel in den beiden Grundgesamtheiten ohne bzw. mit Gabe von P.
Verfahren: zweiseitiger Zweistichproben-Gauß-Test für unabhängige Stichproben
und
Entscheidung: H0 wird zugunsten von H1 verworfen. Mit einer Irrtumswahrscheinlichkeit von höchstens 0,05 wurde nachgewiesen, dass sich bzgl. der Gabe bzw. Nicht-Gabe von P die B-Werte im Mittel unterscheiden.

Nun soll ein Versuch mit abhängigen Stichproben betrachtet werden. Bei umfangreichen Vorher-Nachher-Untersuchungen wurde für die Veränderung der B-Werte durch die Gabe der betroffenen Pharmaka ebenfalls eine Normalverteilung gefunden, mit . In der Tabelle der Messwerte seien nun die jeweils übereinander stehenden Messwerte in einem Vorher-Nachher-Versuch ermittelt worden.

  • 3. Hypothese: Die Werte von B liegen nach Gabe von P im Mittel um mehr als 1,25 oberhalb der Werte vor Gabe von P.
Verfahren: linksseitiger Zweistichproben-Gauß-Test für abhängige Stichproben
und
Entscheidung: H0 wird zugunsten von H1 verworfen. Mit einer Irrtumswahrscheinlichkeit von höchstens 0,05 wurde nachgewiesen, dass bei Vorher-Nachher-Untersuchungen die B-Werte nach Gabe von P im Mittel um mehr als 1,25 oberhalb der B-Werte vor Gabe von P liegen.

Siehe auch

Literatur

  • Rönz/Strohe (Hrsg.): Lexikon Statistik. Gabler, 1994, ISBN 978-3-409-19952-0.
  • Irle: Wahrscheinlichkeitstheorie und Statistik. Kap. 20. Vieweg und Teubner, 2. Aufl. 2005, ISBN 978-3-519-12395-8.
  • Cramer/Kamps: Grundlagen der Wahrscheinlichkeitsrechnung und Statistik: Ein Skript für Studierende der Informatik, der Ingenieur- und Wirtschaftswissenschaften. S. 271ff. Springer, 2. Aufl. 2008, ISBN 978-3-540-77760-1.