Index
 
Einleitung
Univariate Statistik
Mittelwert, Median und Modus
Normalverteilung von Differenzen
Wahrscheinlichkeit
Statistische Tests
Signale
Fouriertransformation
Korrelation
Kalibration
Regression
Datensätze

Normalverteilung von Differenzen

Frage
Frage A: Angenommen man hat zwei gleich große Stichproben, von denen jede normalverteilt ist: Muss die Verteilung der Paardifferenzen der beiden Stichproben ebenfalls einer Normalverteilung folgen?
Frage B: Angenommen, die beiden Stichproben sind nicht normalverteilt. Kann man daraus schließen, dass die Paardifferenzen ebenfalls nicht normalverteilt sind?

 

Hintergrund: Beim t-Test für verbundene Stichproben (Differenzen-t-Test) ist eine der Voraussetzungen, dass die Paardifferenzen der beiden Stichproben normalverteilt sein müssen. Man könnte also versucht sein, die beiden Stichproben getrennt auf Normalverteilung zu untersuchen und für den Fall, dass beide Stichproben normalverteilt sind, annehmen, dass dies für die Differenzen ebenfalls gilt. Umgekehrt könnte man bei Ablehnung der Nullhypothese, dass in beiden Fällen eine Normalverteilung vorliegt, schließen, dass der t-Test nicht durchgeführt werden darf, weil die Differenzen ebenfalls nicht normalverteilt sind. Was davon ist nun korrekt?
Antwort

Frage A

Die Antwort auf die erste Frage gibt die statistische Theorie: falls die beiden Stichproben normalverteilt und von einander unabhängig sind, gilt für die Paardifferenzen, dass diese ebenfalls normalverteilt sind. In den meisten praktischen Fällen wird die Unabhängigkeit aber nicht gegeben sein, was dazu führen kann, dass die Paardifferenzen zweier normalverteilter Stichproben nicht mehr normal verteilt sind.

Sie können das leicht in einem kleinen Experiment überprüfen: Erzeugen Sie dazu zwei normalverteilte Stichproben mit gleichem Mittelwert und gleicher Standardabweichung [Abb. a und b]. Plottet man die beiden Stichproben gegeneinander, so sieht man, dass die Werte unabhängig (unkorreliert) sind [Abb. c]. Berechnen Sie daraus die Paardifferenzen D1 [Abb. d]. Als nächstes sortieren Sie die beiden Stichproben und erzeugen für die sortierten Werte ebenfalls die Paardifferenzen (D2) (durch das Sortieren werden die beiden unabhängigen Stichproben in Abhängigkeit zueinander gebracht, vgl. Abb e). Wie Sie leicht durch ein Histogramm [Abb. d und f] bzw. einen statistischen Test erkennen können, sind die Paardifferenzen D1 normalverteilt, während die Differenzen D2 das im Allgemeinen nicht sind.

Das bedeutet nun für den Differenzen-t-Test, dass die getrennte Überprüfung auf Normalverteilung der beiden Stichproben keinen Sinn macht, da man daraus nicht auf die Verteilung der Differenzen schließen kann (die beiden Stichproben sind ja nicht unabhängig von einander).

Frage B

Die zweite Frage lässt sich leicht durch ein einfaches Gedankenexperiment beantworten: Angenommen wir haben eine beliebige, nicht normalverteilte Stichprobe S1. Wir addieren nun zu den Werten dieser Stichprobe normalverteilte Zufallszahlen deren Varianz deutlich kleiner ist als die Varianz der Stichprobe S1 und erhalten daraus die Stichprobe S2. Diese wird nun ebenfalls nicht normalverteilt sein und der Verteilung der Stichprobe S1 ähnlich sein. Die Paardifferenzen der beiden Stichproben sind aber selbstverständlich normalverteilt (wir haben ja normalverteilte Zufallszahlen addiert). Daraus folgt für den Differenzen-t-Test, dass selbst bei Vorliegen von nicht-normalverteilten Stichproben, die Differenz normalverteilt sein kann und somit der Test durchgeführt werden darf.

Wir sehen also aus der Betrachtung der beiden Fragen A und B, dass man bei Differenzen-t-Tests immer die Normalverteilung der Paardifferenzen überprüfen muss, eine Überprüfung der einzelnen Verteilungen ist zu wenig.

 

Anleitung
(kommt noch....)