Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Kombination mehrerer Einzelverteilungen

Author: Hans Lohninger

Was passiert, wenn man die Verteilungen mehrerer Stichproben jeweils einzeln betrachtet, dann alle Beobachtungen aller Stichproben zu einer einzigen Stichprobe vereinigt, und die Verteilung der vereinigten Stichprobe betrachtet? Die Beantwortung dieser Frage ist wichtig für das Verständnis der ANOVA.

Untersuchen wir dazu zunächst ein konkretes Beispiel: angenommen, wir haben vier normalverteilte Stichproben von denen wir nur wissen, dass die Varianzen dieser vier Stichproben gleich sind (wir kennen aber nicht deren Größe). Außerdem wissen wir nichts über die Mittelwerte der vier Stichproben. Wie sieht nun die Verteilung aus, die sich ergibt, wenn man alle Beobachtungen dieser vier Stichproben in einen Topf wirft (also eine Stichprobe mit entsprechend mehr Beobachtungen macht)?

Unterscheiden wir dazu zwei Fälle: (1) die Mittelwerte der Einzelstichproben sind gleich, und (2) die Mittelwerte der Einzelstichproben unterscheiden sich zumindest bei einer Stichprobe.

Die Verteilung der vereinigten Stichprobe (schwarz) ist exakt gleich der Verteilung der Einzelstichproben (die fünf Verteilungskurven liegen übereinander).
Fall 1: Gleiche Mittelwerte der Einzelstichproben

Falls die Mittelwerte der Einzelproben gleich sind (die Varianzen sind ja entsprechend unserer Voraussetzung ohnehin gleich), so weist die Verteilung der vereinigten Stichprobe dieselben Parameter auf, wie jede Einzelstichprobe. Im Detail bedeutet das, dass die Varianz der Gesamtprobe gleich der der Einzelproben ist.

Die Verteilung der vereinigten Stichprobe (schwarz) ist deutlich breiter als die Verteilung jeder einzelnen Stichprobe. Diese Verbreiterung der Varianz der vereinigten Stichprobe ist Grundlage der Varianzanalyse.
Fall 2: Unterschiedliche Mittelwerte der Einzelstichproben

Kombiniert man nun die Einzelproben, von denen zumindest eine nicht den selben Mittelwert aufweist, so ergibt sich für die Varianz der vereinigten Stichproben eine Aufweitung (obwohl die Varianzen der Einzelstichproben nach wie vor gleich sind).

Diese Aufweitung der Varianz der vereinigten Stichprobe gibt uns nun die Möglichkeit, durch den Vergleich der Varianzen der Einzelstichproben und der Gesamtstichprobe (durch einen F-Test) auf die Gleichheit der Mittelwerte der Einzelproben zu schließen. Denn nur - und nur dann - wenn die Mittelwerte der Einzelproben gleich sind, erfährt die Varianz der Gesamtstichprobe keine Aufweitung. Dieses Prinzip - auf Gleichheit der Mittelwerte zu testen in dem man die Gesamtvarianz untersucht - ist die Grundlage der ANOVA.



Last Update: 2012-11-25