Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Übung - Zufallskorrelation

Author: Hans Lohninger

Die folgende Übung zeigt Ihnen den Einfluss von Zufallskorrelationen auf die Ergebnisse eines multivariaten Modells. Das Experiment sollte mit einem künstlichen Datensatz, der nur unkorrelierte Daten enthält, durchgeführt werden. Theoretisch sollte es nicht möglich sein, ein multivariates Modell in Bezug auf die verbleibenden Daten für irgendeine Variable des Datensatzes anzusetzen. Wir werden mit 100 Beobachtungen beginnen und die Zahl der Beobachtungen während den Wiederholungen des Experiments reduzieren (verwenden Sie das  DataLab  für alle Experimente).

  1. Erstellen Sie eine leere Matrix, die 15 Spalten (Variablen) und 100 Reihen (Beobachtungen) enthält. Füllen Sie diese Datenmatrix mit unkorrelierten Daten.
  2. Berechnen Sie ein multiples lineares Regressionsmodell, indem Sie die erste Spalte als die Zielvariable und den Rest als Deskriptorvariablen verwenden. Halten Sie den F-Wert und den Anpassungsgrad fest.
  3. Wiederholen Sie den zweiten Schritt einige Male und reduzieren Sie dabei die Anzahl der Beobachtungen auf 60, 45, 30, 20, 17 und 15.
  4. Erstellen Sie eine Grafik vom Anpassungsgrad und dem F-Wert gegen die Anzahl der Beobachtungen.


Können Sie eine Regel für die Mindestanzahl an Beobachtungen abhängig von der Zahl der Variablen, die akzeptable Ergebnisse für die multiple lineare Regression ergeben, herleiten? Gilt diese Regel auch für neuronale Netzwerke?




Last Update: 2012-10-08