Fundamentals of Statistics contains material of various lectures and courses of H. Lohninger on statistics, data analysis and chemometrics......click here for more.

Extrapolation

Bei der Kurvenanpassung muss man grundsätzlich zwei Bereiche unterscheiden: den Bereich der Interpolation und den Bereich der Extrapolation.

Interpolation

Unter Interpolation versteht man die Abschätzung unbekannter Werte zwischen den bekannten Datenpunkten. Wobei diese Definition in der Praxis die Verhältnisse nicht immer passend widerspiegelt. Es kann nämlich sein, dass zwischen zwei benachbarten Datenpunkten eine große Lücke klafft, die eigentlich eine Interpolation nicht mehr zulässt. Man könnte daher besser den Interpolationsbereich dadurch beschreiben, dass man sich auf die Dichte der bekannten Daten bezieht. Überschreitet diese Dichte eine festgelegte Schwelle, so kann man von Interpolation sprechen.

Anmerkung: Manche Autoren unterscheiden außerdem noch zwischen Interpolation und Approximation. Der Unterschied besteht darin, dass bei Interpolation die bekannten Datenpunkte auf der Kurve liegen müssen, während bei Approximation die errechnete Kurve auch zwischen den bekannten Datenpunkten liegen kann (wie bei einer Regression). Allerdings sind auch für diese Unterscheidung die Grenzen fließend (vgl. z.B. geglättete Splines).

 

Extrapolaton

Von Extrapolation spricht man, wenn Werte in Bereichen des Datenraums abgeschätzt werden sollen, wo keine bekannten Daten ("Trainingsdaten") vorhanden sind, wo also die Dichte der Trainingsdaten null (oder beinahe null) ist. Wie weit die Ergenisse einer Extrapolation gültig sind, hängt hauptsächlich vom gewählten Modell ab. Grundsätzlich gilt, dass die extrapolierten Werte um so unzuverlässiger werden, je mehr Freiheitsgrade der Anpassung ein Modell hat.

Setzt man eine einfache Regressionsgerade als Modell ein, so werden die extrapolierten Werte über einen weiteren Bereich der x-Werte gültig sein, als wenn man ein Spline oder gar ein neuronales Netz verwendet.

 

Beispiel

Die nebenstehende Abbildung vergleicht das Extrapolationsverhalten eines neuronalen Netzes mit dem einer einfachen linearen Regression.

Die Trainingsdaten sind im unteren Teil der Grafik dargestellt. Im mittleren Teil ist das Modell dargestellt, das sich aus der Regression ergibt, und im oberen Bereich das Ergebnis 15 verschiedener neuronaler Netze gezeigt. Wie man deutlich erkennen kann, ist die Antwort des neuronalen Netzes in Bereichen mit verfügbaren Daten konsistent, während an allen anderen Stellen nahezu willkürliche Schätzwerte produziert werden.

Last Update: 2012-10-08