Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Übung - Der Effekt von kollinearen Variablen bei MLR-Modellen

Author: Hans Lohninger

Stark korrelierte Variablen bewirken, dass MLR-Modelle instabil werden. Um das zu zeigen, sollten Sie versuchen, einige kollineare Variablen in den Datensatz BOILPTS einzuführen und ein multiples Regressionsmodell mit und ohne die kollinearen Variablen zu berechnen:

  1. Erstellen Sie zwei Kopien der Variablen "RandicToz" und fügen Sie eine geringe Menge an Rauschen zu beiden Kopien hinzu (2 %).
  2. Berechnen Sie ein MLR-Modell für den Siedepunkt, indem Sie die originale "RandicToz"-Variable und eine der verrauschten Variablen verwenden. Speichern Sie das Protokoll in einer Datei.
  3. Berechnen Sie ein weiteres MLR-Modell. Verwenden Sie dazu die andere verrauschte Variable. Speichern Sie erneut die Protokolldatei.
  4. Erzeugen Sie zwei Kopien der Variablen "JHET" und fügen Sie eine geringe Menge an Rauschen zu beiden Kopien hinzu (2 %).
  5. Berechnen Sie ein drittes MLR-Modell für den Siedepunkt, indem Sie die originale "RandicToz"-Variable und eine der verrauschten "JHET"-Variablen verwenden. Speichern Sie das Protokoll in einer Datei.
  6. Zum Schluss berechnen Sie ein viertes MLR-Modell für den Siedepunkt; verwenden Sie dazu die originale "RandicToz"-Variable und die andere verrauschte "JHET"-Variable. Speichern Sie das Protokoll in einer Datei.
  7. Vergleichen Sie die vier Protokolle. Sehen Sie sich das Bestimmtheitsmaß, den F-Wert und die Regressionskoeffizienten an. Erkennen Sie den Unterschied zwischen den Modellen 1 und 2 sowie den Modellen 3 und 4?


Gehen Sie jetzt zum  DataLab  und führen Sie die oben genannten Schritte durch. Zusätzlich zu dem Vergleich der Regressionsparameter sollten Sie sich die abgeschätzten Werte genauer ansehen. Sie werden erkennen, dass sich die geschätzten Werte für die ersten beiden Datensätze stark unterscheiden, aber nur gering für den dritten und den vierten Satz.




Last Update: 2012-10-08