Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Modellierung mit latenten Variablen

Author: Administrator

Für die Modellierung von Daten mit Hilfe von latenten Variablen gibt es drei oft verwendete Ansätze:

  • Hauptkomponentenregression (engl. principal component regression, PCR): bei der PCR werden die latenten Variablen nur aus den unabhängigen Variablen X errechnet. Einige ausgewählte latente Variablen werden dann als Basis für eine multiple lineare Regression herangezogen mit der die abhängige Variable Y modelliert wird. PCR-Berechnungen können mit Hilfe der Singulärwertzerlegung (SVD) der Matrix XTX durchgeführt werden. Als mathematische Randbedingung für die Ermittlung der Hauptkomponenten dient die maximale Varianz in den unabhängigen Variablen.
  • Maximum redundancy analysis (MRA): Bei der MRA werden die latenten Variablen aus den abhängigen Variablen Y berechnet. Dieser Ansatz sucht nach Richtungen im Faktorraum mit der größten Variation in den abhängigen Variablen. Schätzungen mit diesem Modell sind sehr oft ungenau. MRA-Berechnungen basieren auf der SVD der Matrix YTY. Als mathematische Randbedingung für die Ermittlung der Hauptkomponenten dient die maximale Varianz in den abhängigen Variablen.
  • Partial least squares regression (PLS): Beim PLS-Verfahren wird ein Modell auf zwei Sätzen von latenten Variablen aufgebaut, der eine Satz beruht auf den unabhängigen Variablen X, der andere auf den abhängigen Variablen Y. Der PLS-Ansatz ergibt meistens die besten Resultate. PLS-Berechnungen basieren auf der SVD der Matrix XTY. Als mathematische Randbedingung für die Ermittlung der Hauptkomponenten dient die maximale Kovarianz zwischen den unabhängigen und den abhängigen Variablen.



Last Update: 2012-10-08