Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Regression - Konfidenzintervall

Author: Hans Lohninger

Bei der Berechnung einer Regressionsgeraden wird der Mittelwert der Grundgesamtheit Y bei jedem Wert von X geschätzt. Die Regressionsgerade repräsentiert den Mittelwert i bei jedem Wert der unabhängigen Variablen X. Dieser geschätzte Mittelwert ist normal verteilt. Nun kann man nach dem Konfidenzintervall des geschätzten Y suchen. Es kann gezeigt werden, dass das Verhältnis ( - μy)/s2 einer t-Verteilung mit n-2 Freiheitsgraden folgt. Deshalb kann man das Konfidenzintervall des geschätzten Y wie folgt berechnen:

s2 t1-α;n-2

mit

Wenn man das Konfidenzintervall für die Regressionsgerade grafisch darstellt, erkennt man, dass diese Linien hyperbolisch sind. Das bedeutet, dass das Konfidenzintervall vom X-Wert abhängig ist. Je weiter sich der X-Wert von entfernt, desto größer ist das Konfidenzintervall (innere blaue Kurve im Diagramm unten). Das Band das durch das Konfidenzintervall für alle X-Werte gebildet wird, wird auch Working-Hotelling Konfidenzband genannt.

In der Praxis wird das Konfidenzintervall für die Grundgesamtheit nicht oder nur selten benötigt, da die meisten Schlussfolgerungen auf der Schätzung eines bestimmten, zukünftigen i basieren, das zur Zeit der Regressionsberechnung noch nicht bekannt ist (und das von anderen vorherigen Werten unabhängig ist). Das Konfidenzintervall für zukünftige Beobachtungen ergibt sich aus folgender Gleichung:

s3 t1-α;n-2

mit

Das Konfidenzintervall für konkrete (zukünftige) Werte von Y ist breiter als das Konfidenzintervall für den Mittelwert der Grundgesamtheit (äußere graue Kurve im Diagramm oben). Der Schätzwert für einen konkreten Y-Wert ist also weniger genau als der Schätzwert des Mittelwertes von Y.




Last Update: 2012-10-08