Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Vertrauensbereich

Author: Hans Lohninger

Eine häufige Aufgabenstellung der Statistik ist die (möglichst korrekte) Abschätzung eines bestimmten Parameters (z.B. des Mittelwerts). Während der Berechnung eines Parameters in den meisten Fällen eine einfache mathematische Formel zugrunde liegt, wird die Situation meist dadurch verkompliziert, dass man im Allgemeinen nicht die Grundgesamtheit kennt, sondern nur einen Ausschnitt davon (eine Stichprobe).

Für die Grundgesamtheit ist die Vorgangsweise einfach und klar: Man berechnet den Parameter nach der entsprechenden Formel, die Genauigkeit des berechneten Wertes hängt ausschließlich von der Mess- bzw. Rechengenauigkeit ab. Hat man jedoch nur eine Stichprobe zur Verfügung, so wird der errechnete Parameter in gewissen Grenzen schwanken, wenn man ihn für andere Stichproben der selben Grundgesamtheit berechnet. Der berechnete Parameter wird um den wahren Wert - den wir aber nicht kennen, da wir ja die Grundgesamtheit nicht kennen - schwanken.

Die Frage, die sich nun stellt ist, in welchem Bereich liegt der wahre Wert, wenn wir den errechneten Parameter einer Stichprobe kennen. Diese Frage lässt sich nicht mit absoluter Sicherheit beantworten, sondern nur mit einer gewissen Wahrscheinlichkeit, da die verwendete Stichprobe ja auch eine zufällige außergewöhnliche Abweichung aufweisen könnte und damit der daraus berechnete Parameter weit weg vom wahren Wert liegen würde.

Um das Problem der korrekten Abschätzung eines Parameters in den Griff zu bekommen, bedient man sich einer Wahrscheinlichkeitsabschätzung. Man berechnet den Parameter aus der Stichprobe und zusätzlich einen Bereich um den Stichproben-Parameter, der den wahren Wert mit einer bestimmten Wahrscheinlichkeit p einschließt. Für p nimmt man meist 95%, es sind aber auch 99% oder 99.9% denkbar. Diese Wahrscheinlichkeit nennt man die Vertrauenswahrscheinlichkeit (engl. confidence coefficient) oder statistische Sicherheit, das Intervall um den Stichprobenparameter nennt man Vertrauensbereich (engl. confidence interval) oder Konfidenzintervall.

Beispiel: Angenommen, man hat die Körpergröße von 17 zehnjährigen Mädchen gemessen und folgende Werte erhoben (in cm):
    124.5, 136.8, 147.6, 142.6, 154.2, 126.6,
    152.0, 145.4, 147.6, 136.1, 135.5, 137.1,
    139.7, 149.1, 142.5, 134.5, 155.9
Berechnet man daraus den Mittelwert, so erhält man einen Wert von 141.6 cm. Das zugehörige Konfidenzintervall bei 95%iger Sicherheit berechnet sich mit +/-4.6 cm. Der wahre Mittelwert liegt also mit 95%iger Sicherheit im Intervall [141.6-4.6, 141.6+4.6] = [137.0, 146.2]. Ändert man die Vertrauenswahrscheinlichkeit auf 99% so wird das Intervall entsprechend breiter (da man ja den wahren Wert mit einer höheren Wahrscheinlichkeit in das Intervall einschließen will): bei 99% ist das Intervall bereits +/-6.4 cm breit. Möchte man absolute Sicherheit über den wahren Wert des Mittelwerts, so wird das Intervall unendlich breit. Man weiß dann nur, dass der Mittelwert "irgendwo" liegt, was ja mit 100%iger Sicherheit richtig ist.




Last Update: 2012-10-14