Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Datenkompression durch PCA

Author: Hans Lohninger

Die Hauptkomponentenanalyse kann auch vom Standpunkt der Datenkompression betrachtet werden. Allerdings ist die Datenkompression mit Hilfe der PCA nur zur Veranschaulichung der PCA hilfreich, da der Kompressionsfaktor eher gering ist und für die Datenkompression viel bessere Methoden zur Verfügung stehen.

Einige Scores der PCA und der korrespondierenden Loading-Vektoren können dazu verwendet werden, den Inhalt einer großen Datenmatrix abzuschätzen. Durch Reduktion der Anzahl an Eigenvektoren, die dazu verwendet werden, die originale Datenmatrix zu rekonstruieren, soll die Größe des erforderlichen Speicherraums verringert werden. Man sollte jedoch vorsichtig sein, weil diese Methode der Kompression nur sinnvoll ist, wenn die Datenmatrix eine hohe Korrelation zwischen den Variablen und Objekten zeigt.

 

Klicken Sie auf das Logo oben, um das interaktive Beispiel, das einige Details dieser Methode zeigt, zu starten.




Last Update: 2012-10-08