Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Bestimmtheitsmaß und MLR

Author: Hans Lohninger

Das Bestimmtheitsmaß r2 für ein multilineares Modell berechnet sich aus dem Korrelationskoeffizienten zwischen geschätzten und wirklichen y-Werten. Es ist ein Indikator dafür, wie gut die Modellgleichung sich an die Daten anpasst.

Allerdings hängt das Bestimmtheitsmaß nicht nur von der Güte der Anpassung ab, sondern auch von der Zahl der Beobachtungen und der Zahl der Variablen. Man kann das Bestimmtheitsmaß für multilineare Modelle willkürlich gegen 1.0 "zwingen", in dem man immer mehr und mehr unabhängige Variablen (Deskriptoren) in die Modellgleichung aufnimmt.

Um diesem Umstand Rechnung zu tragen, kann man entweder aus dem r2 den F-Wert berechnen, oder aber ein korrigiertes r2adj verwenden:

mit n = Zahl der Beobachtungen und k = Zahl der Variablen.

Die folgende Abbildung zeigt die Auswirkung der Korrektur des Bestimmtheitsmaßes. Es wurden für eine mit Zufallszahlen gefüllte Datenmatrix von 30 Objekten und 28 Variablen eine Reihe von MLR-Modellen mit steigender Variablenzahl berechnet. Wie man klar erkennen kann, geht das korrigierte Bestimmtheitsmaß für eine sehr hohe (zu hohe) Zahl an Variablen deutlich zurück.




Last Update: 2012-10-08