Fehler-in-den-Variablen-Modell

Darstellung einer Regressionsabschwächung durch eine Reihe von Regressionsschätzungen in Fehler-in-den-Variablen-Modellen. Zwei Regressionslinien (rot) begrenzten den Suchraum aus pontenziellen Regressionsfunktionen.

In der Statistik sind Fehler-in-den-Variablen-Modelle, auch Messfehlermodelle genannt, Regressionsmodelle für Regression mit stochastischen Regressoren, in der entweder die Antwortvariable oder einige erklärende Variablen mit Fehlern gemessen werden.[1]

Klassisches Fehler-in-den-Variablen-Modell

Gegeben sei im einfachsten Fall ein einfaches lineares Regressionsmodell[2]:

.

Im klassischen Fehler-in-den-Variablen-Modell wird angenommen, dass nur mit zufälligem Fehler beobachtet werden kann, d. h. man hat dann den stochastischen Regressor . Für die Messfehler wird angenommen, dass sie unabhängig und identisch verteilt mit Erwartungswert null und Varianz , unkorreliert mit und unkorreliert mit der Störgröße sind.

Konsequenzen von Fehlern in den Variablen

Messfehler in den erklärenden Variablen führen dazu, dass die gewöhnliche Kleinste-Quadrate-Schätzung nicht konsistent ist.

Einzelnachweise

  1. Jeffrey Marc Wooldridge: Introductory econometrics: A modern approach. 4. Auflage. Nelson Education, 2015, S. 848.
  2. Schneeweiß, H.: Ökonometrie, Physica Verlag 1990 (4. Auflage) Kapitel 7 (3. Auflage 1978)

Auf dieser Seite verwendete Medien

Visualization of errors-in-variables linear regression.png
Autor/Urheber: Rickedanielson, Lizenz: CC BY-SA 4.0
Illustration of wikipedia:regression dilution (or attenuation bias) by a range of regression estimates in wikipedia:Errors-in-variables models. Two regression lines (red) bound the range of linear regression possibilities. The shallow slope is obtained when the independent variable (or predictor) is on the abscissa (x-axis). The steeper slope is obtained when the independent variable is on the ordinate (y-axis). By convention, with the independent variable on the x-axis, the shallower slope is obtained. Green reference lines are averages within arbitrary bins along each axis. Note that the steeper green and red regression estimates are more consistent with smaller errors in the y-axis variable.