Gleitender Mittelwert

Der gleitende Durchschnitt (auch gleitender Mittelwert) ist eine Methode zur Glättung von Zeit- bzw. Datenreihen. Die Glättung erfolgt durch das Entfernen höherer Frequenzanteile. Im Ergebnis wird eine neue Datenpunktmenge erstellt, die aus den Mittelwerten gleich großer Untermengen der ursprünglichen Datenpunktmenge besteht. In der Signaltheorie wird der gleitende Durchschnitt als Tiefpassfilter mit endlicher Impulsantwort (FIR-Tiefpass) beschrieben. In der gleichgewichteten Form stellt der gleitende Durchschnitt das einfachste FIR-Tiefpassfilter dar.

Anwendung findet der gleitende Durchschnitt beispielsweise bei der Analyse von Zeitreihen. Die gleichgewichtete Variante entspricht der Faltung mit einer Rechteckfunktion und führt zu einer Reihe von Problemen, denen beispielsweise mit speziellen Gewichtungen entgegengewirkt werden kann.

Prinzipielles Vorgehen

Die Menge der gleitenden Durchschnitte wird iterativ („gleitend“) über einen Ausschnitt, das „Fenster“, eines gegebenen Signals berechnet. Das verwendete Fenster wird überlappend verschoben, d. h., wiederholt wird der letzte Wert aus dem betrachteten Ausschnitt gestrichen, der erste Wert nach dem Ausschnitt hinzugenommen und ein neuer Mittelwert berechnet. Für die Berechnung des Mittelwerts können die im Fenster vorkommenden Werte anschließend beliebig gewichtet werden.

Die Ergebnismenge der Mittelwerte ist für sich genommen unabhängig. Häufig wird sie jedoch in den Zusammenhang mit einer Position der Eingabemenge gebracht, die „hot spot“ genannt wird. Der hot spot kann im Bereich des Fensters liegen, muss es aber nicht. Bei Zeitreihen wird häufig der letzte Zeitpunkt als hot spot verwendet; in anderen Anwendungsfällen sind zentrierte Abbildungen üblich.

Einfacher gleitender Durchschnitt

Berechnung und Zentrierung der Berechnung

Zentrierte gleitende Durchschnitte der Breite 3 verglichen mit einem binomial gefalteten Signal gleicher Breite. Im Gegensatz zur Dämpfung bzw. Auslöschung der hohen Frequenzen zwischen und (schnelle Wechsel zwischen hohen und niedrigen Werten) wird die Signalphase vom gleitenden Durchschnitt invertiert, d. h., wo zuvor ein hoher Wert war, ist nun ein niedriger, und umgekehrt. Das Binomialfilter verursacht dagegen keine Phaseninversion.

Der einfache gleitende Durchschnitt (englisch simple moving average (SMA)) -ter Ordnung einer diskreten Zeitreihe ist die Folge der arithmetischen Mittelwerte von aufeinanderfolgenden Datenpunkten. Da es sich um eine Zeitreihe handelt, liegt der hot spot auf dem letzten Zeitpunkt. Die nachfolgenden Ausführungen beziehen sich auf diesen Sonderfall.

In Analogie zu Filtern mit endlicher Impulsantwort wird auch Ordnung genannt.

Solch ein gleitender Durchschnitt hat eine Verzögerung (Gruppenlaufzeit) von , d. h. die gemittelten Werte „hinken“ um Zeiteinheiten hinterher.

Diese Verzögerung kann korrigiert werden, indem man den gleitenden Durchschnitt um verschiebt. Dies ist der sogenannte zentrierte Durchschnitt. Dann sind jedoch keine Werte mehr für die ersten und letzten Zeiteinheiten vorhanden. Ohne den Einsatz eines dynamischen Fensters kann diese Lücke nur geschlossen oder zumindest verkleinert werden, indem man eine geringere Ordnung, andere Gewichtungen oder einen Schätzer verwendet.

Der zentrierte einfache gleitende Durchschnitt der Ordnung 3 ist also durch

gegeben.

Ein Beispiel für die Verwendung von derartigen gleitenden Durchschnitten sind die 38- bzw. 200-Tage-Durchschnittswerte von Börsenkursen, die den gleitenden Durchschnitt der vergangenen Börsentage eines Wertpapierkurses beschreiben.

Ein Gleitender-Mittelwert-Filter ist ein Tiefpass-Filter, jedoch werden einzelne Frequenzbereiche stärker oder schwächer gefiltert, und es kommt zu Signalverschiebungen (englisch Lags).

Die Wirkung eines Glei­tender-Mittel­wert-Filters auf ein Chirp-Signal (oberes Drittel). Bis zum „Artefakt“ arbeitet der gleitende Durchschnitt (mittleres Drittel) gut als Tiefpass­filter. Rechts davon jedoch wird das Signal wieder stärker durch­gelassen, mal mit invertierter Phase, mal lediglich gedämpft. Zum Vergleich das Ergebnis nach Anwendung eines binomialen Filters (unteres Drittel).

Gleitender Durchschnitt mit dynamischem Fenster

Der gleitende Durchschnitt -ter Ordnung einer diskreten Menge mit Elementen hat Wertepaare weniger als die Gesamtmenge. Da sehr stark oszillierende Graphen eine entsprechend hohe Ordnung zur ausreichenden Glättung der Ergebnismenge benötigen, kann dieser Effekt einen spürbaren Einfluss auf die Darstellung haben. Die resultierende Trendlinie liegt dann bei nicht zentriertem einfachen gleitenden Durchschnitt verstärkt versetzt und gibt somit eine zunehmend schlechtere Abstraktion der Originaldaten wieder.

Bei einer diskreten Menge kann der Versetzungseffekt durch die Verwendung eines dynamischen Mittelwertfensters vermieden werden. Bei diesem Verfahren wird jeder Mittelwert aus den Parametern bis berechnet. Die Fensterränder und leiten sich aus der jeweiligen relativen Position ab, mit:

ist dabei die (absolute) Position von in . Das mit Hilfe von und definierte dynamische Fenster zur Bildung der Mittelwerte deckt die volle Breite des ursprünglichen Graphen ab und abstrahiert die Originaldaten von Rundungsfehlern abgesehen versetzungsfrei. Geometrisch wird die Position des Elements in der Gesamtmenge auf die Position des Elements in der Auswahlmenge abgebildet. Randelemente landen im entsprechenden Rand, das zentrale Element der Gesamtmenge liegt auch im Auswahlintervall mittig. Je mittiger das Element umso geringer der Versatz.

Die Abbildung zeigt den klassischen gleitenden Mittelwertfilter (ohne Zentrierung) mit Versetzung nach rechts und dem Verlust von 25 Wertepaaren (rote Linie) im direkten grafischen Vergleich mit dem gleitenden Mittelwert unter Verwendung eines dynamischen Fensters (blaue Linie).

Beispiel

Das Wachstum der volkswirtschaftlichen Produktivität zwischen 1891 und 2012 schwankt sehr stark. Der Graph gebildet aus dem gleitenden Mittelwert der Ordnung glättet diese Kurve gut (rote Linie).

Berechnungsbeispiel für den ersten möglichen Wert von 1915

Die geglättete Kurve ist eine zwar aussagekräftige, aber deutlich versetzte Trendlinie. Zudem gehen dabei gut 20 % der Wertepaare verloren. Mit Hilfe eines dynamischen Fensters lassen sich die Werte über die gesamte Breite von berechnen. Das Ergebnis ist eine besonders im Inneren des Untersuchungszeitraums kaum versetzte Trendlinie (blaue Linie).

Berechnungsbeispiel für 1891, 1915 und 2012

Die Menge hat 122 Elemente: , 1891 ist der Zeitindex des ersten Elements und .

Damit folgen und und es wird das Intervall bis betrachtet (die anderen Werte analog).

Online-Berechnung

Durch die Überlappung bei der Berechnung des gleitenden Mittels für zwei aufeinanderfolgende Punkte wird die Summe für Punkte doppelt berechnet. Um diesen redundanten Aufwand zu reduzieren, existiert ein Online-Algorithmus, der mit nur zwei Additionen und Multiplikationen pro Mittelwert auskommt:

Gewichteter gleitender Durchschnitt

Der gewichtete gleitende Durchschnitt der Ordnung einer Zeitreihe ist – analog zum Filter mit endlicher Impulsantwort – definiert als:

Dabei stellt die Gewichtung der jeweiligen Datenpunkte dar (äquivalent zur Impulsantwort des Filters). Wenn , ist das Filter nicht kausal, sondern berücksichtigt zukünftige Werte bei der Durchschnittsbildung. Die Summe über alle Gewichte muss 1 ergeben, da sonst noch eine Verstärkung () oder Dämpfung () hinzukommt.

Ein Beispiel ist das zentrierte Binomialfilter dritter Ordnung mit , , und :

Zentrierter gleitender Durchschnitt mit spektralen Eigenschaften

Über­tragungs­funktion im Frequenz­bereich des glei­tenden Mittel­werts der Breite 3 () im Vergleich mit der eines Binomial­filters gleicher Breite ()

Bildet man den zentrierten gleitenden Durchschnitt -ter Ordnung einer schwach stationären Zeitreihe mit Spektraldichte , dann hat die gefilterte Spektraldichte

mit der Übertragungsfunktion

,

wobei den Fejér-Kern bezeichnet. An der grafischen Darstellung für mit der Übertragungsfunktion kann man die Tiefpass-Eigenschaft erkennen: Frequenzen nahe 0 werden nicht gedämpft. Andererseits zeigt dieses einfache Filter das übliche Antwortverhalten bei der Faltung mit einem Rechtecksignal. Bei einer Filterbreite von 3 werden die Frequenzen bis zum Punkt zunehmend bis zur vollständigen Unterdrückung gedämpft. Frequenzen, die über diesen Punkt hinaus vorhanden sind, werden nicht etwa auch unterdrückt, sondern treten mit invertierter Phase auf.

Das kleinste Binomialfilter mit ungerader Breite und mit den Gewichten , , ist ein Tiefpass-Filter mit für alle Frequenzen. Es dämpft die Frequenzen bis zunehmend und mit konstanter Phasenverschiebung.[1]

Chirp-Signal bis zur Nyquist-Frequenz (oben) und mit gleitendem Durchschnitt (Breite: 7) gefaltete Variante (Mitte). Unten zum Vergleich ein mit einem Binomialfilter gefaltetes Signal (Breite: 7). Die Glättung mit dem gleitenden Durchschnitt sollte zu einem Signal führen, das die tiefen Frequenzen (links) unverändert enthält, die hohen Frequenzen (rechts) jedoch herausfiltert. Zwischen diesen Extremen wird zunehmend gedämpft. Der ungewichtete gleitende Durchschnitt (Mitte) erfüllt diese Aufgabe nur sehr unzureichend, das Binomialfilter dagegen erheblich besser.

Linear gewichteter gleitender Durchschnitt

Ein linear gewichteter gleitender Durchschnitt (engl.: linear weighted moving average (LWMA, meist: WMA)) ordnet den Datenpunkten linear aufsteigende Gewichte zu, d. h. je weiter die Werte in der Vergangenheit liegen, desto geringer ist ihr Einfluss:

Exponentiell geglätteter Durchschnitt

Der exponentiell geglättete Durchschnitt ordnet den Datenpunkten einer Zeitreihe exponentiell abnehmende Gewichte zu. Somit werden auch hier jüngere Datenpunkte stärker gewichtet als weiter zurückliegende, jedoch noch stärker als beim gewichteten gleitenden Durchschnitt.

Da der exponentielle Durchschnitt nicht nur Werte aus der Zeitreihe, sondern auch vorangegangene Mittelwerte miteinbezieht, stellt er ein Filter mit unendlicher Impulsantwort dar. Ein entscheidender Vorteil ist seine wesentlich kürzere Verzögerung bei gleicher Glättung.

Exponentiell gewichteter geglätteter Durchschnitt

Der exponentiell gewichtete geglättete Durchschnitt (EMWA) ist eine Verallgemeinerung des exponentiell geglätteten Durchschnitts, wobei Gewichte eingeführt werden.

Siehe auch

Literatur

  • John G. Proakis, Dimitris G. Manolakis: Digital Signal Processing. 4. Auflage. Prentice Hall, 2007, ISBN 978-0-13-187374-2.
Wikibooks: Gleitende Durchschnitte – Lern- und Lehrmaterialien

Einzelnachweise

  1. Jens-Peter Kreiß, Georg Neuhaus: Einführung in die Zeitreihenanalyse. Springer, 2006, ISBN 3-540-25628-8.

Auf dieser Seite verwendete Medien

FrequenzSweepGlMWBinomial7.png
Autor/Urheber: de:Benutzer:Gut informiert, Lizenz: CC0
Frequenzsweep bis zur Nyquist-Frequenz und per gleitendem Mittelwert gefaltete Signalvarianten (einmal ungewichtet, einmal binomial)
Frequenzsweep-Grafisch.png
Autor/Urheber: Benutzer:Gut informiert, Lizenz: CC0
Als Grauwertbild dargestellter Frequenzsweep bis zur Nyquist-Frequenz (oben). Darunter die mit einem einfachen gleitenden Mittelwert sechster Ordnung geglättete Variante. Zuunterst eine mit einem Binomialfilter getiefpasste Version (Filterkoeffizienten: 1/64 * [1 6 15 20 15 6 1])
MittelwertSignalvergleich3.svg
Vergleich verschiedener gleitender Mittelwerte: Zu dem im oberen Teil abgebildeten Signal ([6 20 15 15 12 12 16 9 26 12 27 11 17 25 20 15 25 20 16 19]) wird in der Mitte der gleitende Mittelwert dritter Ordnung (Filtermaske (1/3)*[1 1 1], Werte

1/3 * [41 50 42 39 40 37 51 47 65 50 55 53 62 60 60 60 61 55]) abgebildet. Darunter befindet sich der Vergleichsmittelwert eines binomial gewichteten gleitenden Mittelwerts (Filtermaske (1/4)*[1 2 1], Werte

1/4 * [61 65 57 51 52 53 60 73 77 77 66 70 87 80 75 85 81 71]). Man beachte in der Mitte des Bildes die invertierende Reaktion des ungewichteten gleitenden Mittelwerts auf schnelle Signaländerungen (im Gegensatz zur eigentlich erwarteten Glättung, da Tiefpass).
Bin3ma3transf.svg
Autor/Urheber: Erzbischof, Lizenz: CC BY-SA 3.0
Comparison of transfer function for centered moving average order 3 and centered binomial filter of order 3. Both have a real transfer function. For frequencies, where the transfer function is negative (red for the MA3), the signals have lag 1 after filtering.

f <- function (l)1/3*(sin(l*3/2)/sin(l/2)) x <-seq(0,pi, l=100) plot(x, f(x), t="l", xlim=c(0,pi), col="blue", ann=F, yaxt="n", xaxt="n", frame.plot=F) axis(1, pos=0, labels=c("","","","",""), at=c(0,pi/3, pi/2, 2*pi/3, pi)) axis(2, pos=0) x <-seq(2/3*pi,pi, l=100) lines(x, f(x), t="l", col="red")

f <- function (l)1/2*(1 + cos(l)) x <-seq(0,pi, l=100) lines(x, f(x), t="l", col="blue")

Retouched with Inkscape.
Gleitender Mittelwert auf diskreten Daten.png
(c) MikoRedBaron, CC BY-SA 3.0 de
Die Abbildung zeigt den Vorteil eines dynamischen Fensters zur Berechnung des gleitenden Durchschnitts