|
Übung Abhängigkeit der Hauptkomponente von der Skalierung der Daten
Diese Übung wird Ihnen die Ergebnisse einer Hauptkomponentenanalyse und
deren Abhängigkeit von der Skalierung der Originaldaten zeigen. Die Daten,
die in dieser Übung verwendet werden, beinhalten zwei Klassen, die entweder
durch das Verwenden einer Kombination der ersten und der zweiten Variablen
oder durch das alleinige Verwenden einer dritten Variablen unterschieden werden
können. Hauptkomponentenplots sind nützlich, um sich die Daten auf eine
"multidimensionale" Art anzusehen, wobei die Richtung der Hauptkomponenten
von der Skalierung der Daten abhängen kann.
Gehen Sie ins DataLab ,
um selbst zu experimentieren. Sie sollten sich den Datensatz zuerst mit der
3-D-Rotationsoption ansehen. Wenn Sie die Box "isometrische Achsen" ankreuzen,
sehen Sie die Beziehung zwischen den drei Variablen maßstabsgerecht.
Als Nächstes sollten Sie die Hauptkomponenten mittels verschiedener
Skalierungsoptionen berechnen und die Ergebnisse vergleichen. Warum zeigt der
Hauptkomponentenplot die zwei Klassen nur als separate Cluster, wenn die Daten
vor der Hauptkomponentenanalyse standardisiert worden sind?
|