Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Zeitreihen - Aufstellen von ARIMA-Modellen

Author: Hans Lohninger

Die Vorgehensweise beim Finden geeigneter ARIMA-Modelle wurde intensiv untersucht; es wurden entsprechende Methoden gefunden: Eine ist die so genannte "Box-Jenkins-Methode"; sie wird in [Box and Jenkins, 1970] beschrieben und im Folgenden kurz skizziert.

1. Auswahl des Modells

Für die Auswahl eines ARIMA[p,d,q]-Modells müssen die Werte p, d und q bestimmt werden. In dieser Phase ist es wichtig, so viel relevante Informationen wie möglich über die zu modellierende Zeitreihe zu sammeln. Die ersten Schritte umfassen das Filtern von Trends und das Entfernen von saisonbedingten Effekten. Um die beste Wahl für d zu finden, kann die Korrelationsfunktion herangezogen werden. Aus Erfahrung weiß man, welche Filter abhängig von der Form der Korrelationsfunktion zu verwenden sind. Außerdem gibt es Erfahrungswerte für die Auswahl des geeigneten Modells für Zeitreihen mit p<= 2 und q <= 2. Überraschenderweise kann der Großteil der Zeitreihen mit solch einfachen Modellen sehr gut modelliert werden. Die Autokorrelationsfunktion (AKF) und die partielle Autokorrelationsfunktion (PAKF) können für die Bestimmung von p und q der ARIMA[p,d,q]-Modelle verwendet werden. Sie werden für eine limitierte Zahl von Zeitverzögerungen τ, z.B. 20, bestimmt. Dann werden Vertrauensbereiche (z.B. 95%-Intervalle) berechnet. Die Zeitverzögerungen τ, die außerhalb der Vertrauensintervalle liegen, können als p und q angenommen werden. Zeitverzögerungen, die außerhalb des Vertrauensintervalls um die AKF gefunden werden, weisen darauf hin, dass ein MA[τ]-Modell verwendet werden sollte, während die, die um die PAKF liegen, andeuten, dass ein AR[τ]-Modell geeignet sein könnte.

2. Abschätzung der Parameter

Um den Wert x(t) einer Zeitreihe mit einem ARIMA[p,d,q]-Modell zu schätzen, müssen zuerst p, d und q gewählt werden. Die Zahl der Differenzierungsschritte d bestimmt, wie oft die Originalzeitreihe differenziert wird, ehe die jeweilige Formel angewendet werden kann. Dieses Verfahren ist für die Filterung von Trends notwendig.

Wenn p, d und q eines ARIMA-Modells gegeben sind, können die Parameter αi und βj abgeschätzt werden. Dies wird durch Minimieren des Fehlers erreicht, der sich aus dem Abstand der Originalzeitreihe von der geschätzten Zeitreihe ergibt. Wenn d > 0 verwendet wird, werden die Fehler für die d-te Ableitung der Zeitreihe genommen.


3. Überprüfung der Leistung des Modells

Um die Leistung des Modells zu überprüfen, ist es wichtig, unabhängige Testdatensätze zu verwenden, die aus Zeitreihen bestehen, die noch nicht in den Modellierungsprozess miteinbezogen wurden. Der Fehler in diesen unabhängigen Testsätzen wird mit denen, die aus anderen Modellen erhalten wurden, verglichen. Normalerweise ist der Fehler ein Wert, der durch Anwenden einer Funktion auf den Unterschied zwischen dem beobachteten und dem Voraussagewert erhalten wird.

Box und Jenkins empfehlen, sich die Autokorrelationsfunktionen der Zeitreihen und der Fehler anzusehen. Enthält die Letztere verdächtige Peaks, verwertet das Modell nicht alle verfügbaren Informationen. Desweiteren ist es sinnvoll, die Leistung von ARIMA-Modellen höherer Ordnung zu beurteilen: ARIMA[p+1,d,q] und ARIMA[p,d,q+1]. Dadurch zeigt sich, ob Modelle höherer Ordnung die Voraussage verbessern. Wenn ein Modell keine besseren Voraussagen liefert, wird das Modell geringerer Ordnung bevorzugt, da es weniger Parameter besitzt. Um Unter- und Überdifferenzierung zu vermeiden, sollten auch Modelle mit höherem und geringerem d (ARIMA[p,d-1,q] und ARIMA[p,d+1,q]) getestet werden. Letztlich sollten auch komplexere Modelle überprüft werden.




Last Update: 2012-10-08