RESET-Test nach Ramsey

Der RESET-Test nach Ramsey bzw. Test auf Fehlspezifikation der Regressionsgleichung nach Ramsey (englisch Ramsey Regression Equation Specification Error Test) ist ein von James B. Ramsey 1969 vorgeschlagener Test in der Statistik zur Überprüfung der Modellspezifikation im Rahmen der linearen Regression.[1] Er prüft, ob nichtlineare Kombinationen der erklärenden Variablen einen Einfluss auf die erklärte Variable haben. Falls die nichtlinearen Kombinationen der erklärenden Variablen einen Einfluss haben, dann sollte die lineare Modellspezifikation überdacht werden. Aber auch Fehlspezifikationen wie das Nichtberücksichtigen relevanter Variablen, Strukturbrüche, Homoskedastizität etc. können durch den Test angezeigt werden.[2] Ein Vorteil des RESET-Test nach Ramsey ist es, dass kein explizites Alternativmodell spezifiziert werden muss; der Nachteil, dass er aber auch keinen Hinweis auf eine „richtige“ Spezifikation liefert.

Mathematische Formulierung

Im linearen Modell wird folgende Modellspezifikation angenommen

und man schätzt

Der Test prüft, ob ein nichtlineares Modell der Form

nicht eine größere Erklärungskraft als das lineare Modell hat.

Die Hypothesen sind

vs. .

Die Teststatistik ist

mit

  • : das Bestimmtheitsmaß des linearen Modells,
  • : das Bestimmtheitsmaß des nichtlinearen Modells,
  • : der Stichprobenumfang,
  • : die Anzahl der erklärenden Variablen und
  • : die Anzahl der zusätzlichen Parameter im nichtlinearen Modell.

Werden auch die Koeffizienten der linearen Regression im nichtlinearen Modell neu geschätzt und unterscheiden sie sich wesentlich von den geschätzten Koeffizienten im linearen Modell, so ist dies auch ein Hinweis auf eine Fehlspezifikation.

Der RESET-Test nach Ramsey lässt sich auch auf verallgemeinerte lineare Modelle erweitern.[3]

Beispiel

Lineare Regression bei einem nichtlinearen Zusammenhang.

In den Boston-Housing-Daten wird der mittlere Kaufpreis von Häusern pro Bezirk (medv) in Abhängigkeit vom Anteil der Unterschichtbevölkerung (lstat) mittels einer einfachen linearen Regression geschätzt. Die Regressiongerade im Streudiagramm zeigt deutlich, dass der Zusammenhang zwischen den beiden Variablen nichtlinear ist.

Der RESET-Test nach Ramsey (mit und ) ergibt folgendes Ergebnis:

 RESET test
data:  linreg
RESET = 83.4103, df1 = 2, df2 = 502, p-value < 2.2e-16

Wie die Grafik bereits nahelegt, wird die Nullhypothese verworfen, da der p-Wert kleiner ist als z. B. ein Signifikanzniveau von .

Einzelnachweise

  1. J.B. Ramsey: Tests for Specification Errors in Classical Linear Least-squares Regression Analysis. In: Journal of the Royal Statistical Society, Series B. Band 31, Nr. 2, 1969, S. 350–371, JSTOR:2984219.
  2. Peter Hackl: Einführung in die Ökonometrie. Addison-Wesley Verlag, 2004, ISBN 978-3-8273-7118-8.
  3. Sunil Sapra: A regression error specification test (RESET) for generalized linear models. In: Economics Bulletin. Band 3, Nr. 1, 2005, S. 1–6 (economicsbulletin.com [PDF; abgerufen am 9. September 2012]). A regression error specification test (RESET) for generalized linear models (Memento vom 25. Dezember 2015 im Internet Archive)

Auf dieser Seite verwendete Medien

ScatterLstatMedv.svg
Autor/Urheber: Sigbert, Lizenz: CC BY-SA 3.0
The scatterplot shows the relationship between the precentage of lower status people (lstat) and the median houseprice (medv) per district in Boston. The date were first used in Harrison and Rubinfeld (1978). Hedonic prices and the demand for clean air. Journal of Environmental Economics and Management, 5, 81–102.