Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


MLR und (Multi)Kollinearität

Author: Hans Lohninger

Kollineare Variablen sind das größte Problem der multiplen linearen Regression (man spricht auch von Multikollinearität). Zwei Variablen sind kollinear, wenn sie ungefähr (oder exakt) linear abhängig sind; oder anders gesagt, wenn es eine hohe Korrelation zwischen den zwei Variablen gibt. Wenn ein Modell auf zwei hoch korrelierten Variablen basiert, werden die geschätzten Regressionskoeffizienten instabil. Das macht die Koeffizienten für kausale Interpretationen unbrauchbar.

Es gibt einige Möglichkeiten, die Kollinearität zu detektieren, die wichtigsten seien im Folgenden aufgeführt:

  • Man sieht in der Kreuzkorrelationstabelle nach. Die Kreuzkorrelationstabelle zeigt nur Kollinearitäten zwischen zwei Variablen auf. Wenn lineare Zusammenhänge zwischen mehr als zwei Variablen bestehen, ist die Kreuzkorrelationstabelle nur von beschränkter Brauchbarkeit. Darüber hinaus wird die Korrelation stark durch Ausreißer beeinflusst.
  • Der Variance Inflation Factor (VIF) misst den Anstieg der Varianz im Vergleich zu einer orthogonalen Basis.
  • Die Konditionierung einer Streumatrix XTX lässt sich durch die Quadratwurzel des Verhältnisses des größten und des kleinsten Eigenwerts angeben. Dieser Wert ist groß, wenn eine Kollinearität zwischen den Variablen besteht.

MLR und lineare Abhängigkeiten - über instabile Parameter und andere Ärgernisse.




Last Update: 2012-10-08