Autokorrelation

Die Autokorrelation (auch Kreuzautokorrelation^[1]) ist ein Begriff aus der Stochastik und der Signalverarbeitung und beschreibt die Korrelation einer Funktion oder eines Signals mit sich selbst zu einem früheren Zeitpunkt. Korrelationsfunktionen werden für Folgen von Zufallsvariablen $x(t)$ berechnet, die von der Zeit $t$ abhängen. Diese Funktionen geben an, wie viel Ähnlichkeit die um die Zeit $\tau$ verschobene Folge $x(t-\tau )$ mit der ursprünglichen Folge $x(t)$ hat. Da die unverschobene Folge mit sich selbst am ähnlichsten ist, hat die Autokorrelation für die unverschobene Folge $(\tau =0)$ den höchsten Wert. Wenn zwischen den Gliedern der Folge eine Beziehung besteht, die mehr als zufällig ist, hat auch die Korrelation der ursprünglichen Folge mit der verschobenen Folge in der Regel einen Wert, der signifikant von Null abweicht. Man sagt dann, die Glieder der Folge sind autokorreliert.

Da die Folge $x(t)$ mit einer verschobenen Version ihrer selbst verglichen wird, spricht man von einer Autokorrelation. Werden hingegen zwei verschiedene Folgen $x(t)$ und $y(t-\tau )$ verglichen, spricht man von einer Kreuzkorrelation. Mit der Autokorrelation ist es möglich, Zusammenhänge zwischen den beobachteten Ergebnissen zu verschiedenen Beobachtungszeitpunkten einer Messreihe festzustellen. Die Kreuzkorrelation gibt dagegen die Korrelation zwischen verschiedenen Merkmalen in Abhängigkeit von der Zeit an.

In der Signalverarbeitung geht man häufig auch von kontinuierlichen Messdaten aus. Man spricht von Autokorrelation, wenn die kontinuierliche oder zeitdiskrete Funktion (z. B. ein- oder mehrdimensionale Funktion über die Zeit oder den Ort) mit sich selbst korreliert wird, beispielsweise $x(t)$ mit $x(t+\tau )$ . Mit dem Durbin-Watson-Test kann anhand einer Stichprobe überprüft werden, ob eine Zeitreihe oder räumliche Daten eine Autokorrelation aufweisen.

Die Autokorrelation wird in den verschiedenen Disziplinen unterschiedlich definiert. In der Statistik wird sie für stochastische Prozesse $X_{t}$ als normierte Form der Autokovarianz berechnet, in der Signalverarbeitung als Faltung des zeitabhängigen Signals $x(t)$ mit sich selbst. In manchen Gebieten werden die Begriffe Autokorrelation und Autokovarianz auch synonym verwendet.

In einem Korrelogramm kann die geschätzte Autokorrelation inklusive Konfidenzintervallen grafisch dargestellt werden und so schnell die statistische Signifikanz einer geschätzten Autokorrelation bewertet werden. Alternativ kann auch der Portmanteau-Test zum Test auf Autokorrelation verwendet werden.

Autokorrelation in der Stochastik

In der Stochastik beschreibt die Autokovarianzfunktion oder Kovarianzfunktion die Kovarianz zwischen den Zufallsvariablen eines reellwertigen stochastischen Prozesses $(X_{t})_{t\in T}$ mit zwei verschiedenen Indizes (z. B. Zeitpunkten im Fall $T\subseteq \mathbb {R}$ ).

Definition

Für einen reellwertigen stochastischen Prozess $(X_{t})_{t\in T}$ mit endlichen Varianzen, d. h. $\mathrm {Var} (X_{t})<\infty$ für alle $t\in T$ , heißt die Funktion $\gamma \colon T\times T\to \mathbb {R}$ ,

\gamma (t_{1},t_{2})=\operatorname {Cov} (X_{t_{1}},X_{t_{2}})=\operatorname {E} [({X_{t_{1}}}-{\mu _{t_{1}}})({X_{t_{2}}}-{\mu _{t_{2}}})],\quad {\text{für alle }}t_{1},t_{2}\in T

(Auto-)Kovarianzfunktion des stochastischen Prozesses. Hierbei bezeichnet $\operatorname {E} [\cdot ]$ den Erwartungswert und ${\mu _{t}}$ den Erwartungswert von $X_{t}$ . Die Existenz und Endlichkeit dieser Erwartungswerte ergibt sich aus der Endlichkeit der Varianzen. Für $t_{1}=t_{2}=t$ ist die Autokovarianz identisch mit der Varianz, d. h. $\gamma (t,t)=\mathrm {Var} (X_{t})$ .

Für einen reellwertigen stochastischen Prozess mit $T\subseteq \mathbb {R}$ , der schwach stationär (stationär im weiteren Sinn) ist, sind die Größen Erwartungswert, Standardabweichung und Varianz der Zufallsvariablen $X_{t}$ für $t\in T$ nicht zeitabhängig. Die Autokovarianzen $\gamma (t_{1},t_{2})$ sind dann nicht von der Lage der Zeitpunkte $t_{1}$ und $t_{2}$ , sondern nur von der Zeitdifferenz $\tau =t_{2}-t_{1}$ zwischen $t_{1}$ und $t_{2}$ abhängig, es gilt also

\gamma _{\tau }:=\gamma (t,t+\tau )=\operatorname {E} \left[\left({X}_{t}-\mu \right)\left({X_{t+\tau }}-\mu \right)\right],

wobei $\mu =\operatorname {E} [X_{t}]$ für alle $t\in T$ .

Die Autokorrelationsfunktion des stochastischen Prozesses wird, falls dieser positive Varianzen für alle Zeitpunkte besitzt, definiert als normierte Autokovarianzfunktion:

\varrho \left(t_{1},t_{2}\right)={\frac {\gamma \left(t_{1},t_{2}\right)}{\sigma _{t_{1}}\sigma _{t_{2}}}}\qquad {\mbox{ mit}}-1\leq \rho (t_{1},t_{2})\leq +1

Hierbei bedeuten:

$\sigma _{t_{1}}$	Standardabweichung von $X_{t_{1}}$
$\sigma _{t_{2}}$	Standardabweichung von $X_{t_{2}}$
$\rho (t_{1},t_{2})$	Autokorrelation bezogen auf die Zeitpunkte $t_{1}$ und $t_{2}$

In dieser Form ist die Autokorrelationsfunktion einheitenlos und auf den Bereich zwischen −1 und 1 normiert.

Für einen stationären Prozess ist die Autokovarianz nur vom Zeitunterschied $\tau$ zwischen $t_{1}$ und $t_{2}$ abhängig. Die Standardabweichung ist dann unabhängig vom Zeitpunkt, das Produkt der Standardabweichungen im Nenner entspricht dann der von $t$ unabhängigen Varianz $\sigma _{X}^{2}=\operatorname {Var} (X_{t})=\operatorname {Var} (X_{0})$ . Somit vereinfacht sich die Autokorrelationsfunktion für einen stationären Prozess zu:

\varrho \left(t_{1},t_{2}\right)=\varrho _{\tau }={\frac {\gamma _{\tau }}{\sigma _{X}^{2}}}={\frac {\gamma _{\tau }}{\gamma _{0}}}

,

da $\gamma _{0}=\sigma _{X}^{2}$ gilt.

Eigenschaften der Autokorrelationsfunktion

$(X_{t})_{t\in T}$ bezeichne einen reellwertigen stochastischen Prozess mit $T\subseteq \mathbb {R}$ . Falls der Prozess stationär im weiteren Sinn ist, wird im Folgenden vom stationären Spezialfall gesprochen.

Für die Autokorrelationsfunktion gilt

-1\leq \varrho (s,t)\leq 1\quad {\text{für alle }}t\in T\;.

Die Aukorrelationsfunktion ist also – im Unterschied zur Autokovarianzfunktion – normiert, in dem sie nur Werte im Intervall

[-1,1]

annehmen kann.