Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Extrapolation

Author: Hans Lohninger

Bei der Kurvenanpassung muss man grundsätzlich zwei Bereiche unterscheiden: den Bereich der Interpolation und den der Extrapolation.

Von Extrapolation spricht man, wenn Werte in Bereichen des Datenraums abgeschätzt werden sollen, wo keine bekannten Daten ("Trainingsdaten") vorhanden sind, wo also die Dichte der Trainingsdaten null (oder beinahe null) ist. Wie weit die Ergebnisse einer Extrapolation gültig sind, hängt hauptsächlich vom gewählten Modell ab. Grundsätzlich gilt, dass die extrapolierten Werte um so unzuverlässiger werden, je mehr Freiheitsgrade der Anpassung ein Modell hat.

Setzt man eine einfache Regressionsgerade als Modell ein, so werden die extrapolierten Werte über einen weiteren Bereich der x-Werte gültig sein, als wenn man ein Spline oder gar ein neuronales Netz verwendet.

Beispiel: Die nebenstehende Abbildung vergleicht das Extrapolationsverhalten eines neuronalen Netzes mit dem einer einfachen linearen Regression.

Die Trainingsdaten sind im unteren Teil der Grafik dargestellt. Im mittleren Teil ist das Modell dargestellt, das sich aus der Regression ergibt, und im oberen Bereich das Ergebnis 15 verschiedener neuronaler Netze gezeigt. Wie man deutlich erkennen kann, ist die Antwort des neuronalen Netzes in Bereichen mit verfügbaren Daten konsistent, während an allen anderen Stellen nahezu willkürliche Schätzwerte produziert werden.

Interessant auch, dass das neuronale Netzwerk an der Stelle (1) bereits leichte Abweichungen zwischen den einzelnen Trainingsläufen zeigt.




Last Update: 2012-10-12