Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Faktorenanalyse

Author: Hans Lohninger

Die Faktorenanalyse hat eine lange Geschichte und ihre Wurzeln liegen in den Bereichen der Psychologie und Soziologie. Über erste Entwicklungen berichtete Hortelling 1933. Später erweiterten andere Autoren diese Methode, was zu einer Bandbreite von verschiedenen Methoden führte, die schwer zu überblicken ist. Ein exzellentes Buch zur Faktorenanalyse wurde von Paul Horst publiziert [Horst 1965].

Eine der möglichen Definitionen der Faktorenanalyse stammt von Malinowski:

    "Die Faktorenanalyse ist eine multivariate Technik, um eine Datenmatrix auf ihre kleinste Dimension zu reduzieren, indem man orthogonale Faktorräume und Transformationen einsetzt, die Vorhersagen und/oder erkennbare Faktoren liefern." [Malinowski 1991]


Das Prinzip hinter der Faktorenanalyse ist relativ einfach, obwohl der konkrete Einsatz von den Anforderungen der speziellen Situation abhängt und ziemlich anspruchsvoll sein kann. Im Prinzip wird eine Datenmatrix X in ein Produkt von zwei Datenmatrizen aufgespalten:

X = U VT

Die Matrizen U und V werden Score- und Loadings-Matrix genannt. Man kann dies so darstellen:

Bei dieser Vorgehensweise kann es allerdings vorkommen, dass die gefundenen Faktoren für die Lösung eines realen Problems ohne Wert sind. Eines der Hauptziele der Faktorenanalyse ist aber, Faktoren bereitzustellen, die in einer gewissen Weise mit "richtigen" Faktoren verwandt sind. Also sind die Matrizen U und V eher abstrakte Matrizen, die wenig bis gar keine Verbesserung für die Interpretation der Originalmatrix bieten. Es ist deshalb notwendig, einen Weg zu finden, um Faktoren zu ermitteln, die einen Bezug zur Realität haben. Da die theoretische Aufspaltung in die Matrizen U und V viele Lösungen hat, benötigen wir ein zusätzliches Kriterium, um die Zerlegung der Originalmatrix X zu steuern.

Normalerweise werden die folgenden Regeln zur Auffindung passender Faktoren angewandt:

    1) Die Anzahl der Faktoren sollte so gering wie möglich gehalten werden und doch die Komplexität des Datenraums reflektieren. Die korrekte Anzahl an Faktoren zu finden, kann eine ermüdende Aufgabe sein.
    2) Die Faktoren sollten so berechnet werden, dass sie mit realen Effekten des Experiments, von dem die Daten stammen, in Beziehung gesetzt werden können; die Daten sollten z.B. physikalisch sinnvoll sein. Um das zu erreichen, müssen die Faktoren rotiert werden.



Last Update: 2012-10-08