|
Zeitreihen Aufstellen von ARIMA-Modellen
Die Vorgehensweise
beim Finden geeigneter ARIMA-Modelle wurde intensiv untersucht; es wurden
entsprechende Methoden gefunden: Eine ist die so
genannte "Box-Jenkins-Methode"; sie wird in [Box and Jenkins, 1970]
beschrieben und im Folgenden kurz skizziert.
1. Auswahl des
Modells
Für die Auswahl eines ARIMA[p,d,q]-Modells müssen die
Werte p, d und q bestimmt werden. In dieser Phase ist es wichtig, so viel
relevante Informationen wie möglich über die zu modellierende Zeitreihe zu
sammeln. Die ersten Schritte umfassen das Filtern von Trends
und das Entfernen von saisonbedingten Effekten. Um die beste Wahl für d zu
finden, kann die Korrelationsfunktion herangezogen werden. Aus Erfahrung
weiß man, welche Filter abhängig von der Form der Korrelationsfunktion zu
verwenden sind. Außerdem gibt es Erfahrungswerte für die Auswahl des
geeigneten Modells für Zeitreihen mit p<= 2 und q <= 2.
Überraschenderweise kann der Großteil der Zeitreihen mit solch einfachen
Modellen sehr gut modelliert werden. Die Autokorrelationsfunktion (AKF) und die
partielle Autokorrelationsfunktion (PAKF) können für die Bestimmung von p und q
der ARIMA[p,d,q]-Modelle verwendet werden. Sie werden für eine limitierte Zahl
von Zeitverzögerungen t, z.B. 20, bestimmt. Dann werden
Vertrauensintervalle (z.B. 95%-Intervalle) berechnet. Die
Zeitverzögerungen t, die außerhalb
der Vertrauensintervalle liegen, können als p und q angenommen werden.
Zeitverzögerungen, die außerhalb des Vertrauensintervalls um die AKF gefunden
werden, weisen darauf hin, dass ein MA[t]-Modell
verwendet werden sollte, während die, die um die PAKF liegen, andeuten, dass ein
AR[t]-Modell geeignet sein könnte.
2. Abschätzung
der ParameterUm den Wert
x(t) einer Zeitreihe mit einem ARIMA[p,d,q]-Modell zu schätzen, müssen zuerst p,
d und q gewählt werden. Die Zahl der Differenzierungsschritte d bestimmt, wie
oft die Originalzeitreihe differenziert wird, ehe die jeweilige Formel
angewendet werden kann. Dieses Verfahren ist für die Filterung von Trends
notwendig.
Wenn p, d und q eines ARIMA-Modells gegeben sind, können
die Parameter ai und bj
abgeschätzt werden. Dies wird durch Minimieren des Fehlers erreicht, der
sich aus dem Abstand der Originalzeitreihe von der
geschätzten Zeitreihe ergibt. Wenn d > 0 verwendet wird, werden die
Fehler für die d-te Ableitung der Zeitreihe genommen.
3. Überprüfung der Leistung des
Modells Um die
Leistung des Modells zu überprüfen, ist es wichtig, unabhängige Testdatensätze
zu verwenden, die aus Zeitreihen bestehen, die noch nicht in den
Modellierungsprozess miteinbezogen wurden. Der Fehler in diesen unabhängigen
Testsätzen wird mit denen, die aus anderen Modellen erhalten wurden, verglichen.
Normalerweise ist der Fehler ein Wert, der durch Anwenden einer Funktion auf den
Unterschied zwischen dem beobachteten und dem Voraussagewert erhalten
wird.
Box und Jenkins
empfehlen, sich die Autokorrelationsfunktionen der Zeitreihen und der Fehler
anzusehen. Enthält die Letztere verdächtige Peaks, verwertet das Modell nicht
alle verfügbaren Informationen. Desweiteren ist es sinnvoll, die
Leistung von ARIMA-Modellen höherer Ordnung zu beurteilen: ARIMA[p+1,d,q] und
ARIMA[p,d,q+1]. Dadurch zeigt sich, ob Modelle höherer Ordnung die Voraussage
verbessern. Wenn ein Modell keine besseren Voraussagen liefert, wird das Modell
geringerer Ordnung bevorzugt, da es weniger Parameter besitzt. Um Unter- und
Überdifferenzierung zu vermeiden, sollten auch Modelle mit höherem und
geringerem d (ARIMA[p,d-1,q] und ARIMA[p,d+1,q]) getestet werden. Letztlich
sollten auch komplexere Modelle überprüft werden.
|