Index
 
Einleitung
Univariate Statistik
Wahrscheinlichkeit
Statistische Tests
Voraussetzungen beim t-Test
verbundene Stichproben
Chi-Quadrat-Test
Test des Korrelationskoeffizienten
Signale
Fouriertransformation
Korrelation
Kalibration
Regression
Datensätze

Mittelwertsvergleich bei verbundenen Stichproben

Frage
In einem Obstgarten mit Apfelbäumen wurde für zwei verschiedene Jahre, die unterschiedliche Witterung während der Blüte aufwiesen, der Ertrag für neun ausgewählte Bäume ermittelt. Klären Sie, ob die unterschiedliche Witterung zu signifikanten Ertragsunterschieden geführt hat.
Baum:       1    2    3    4    5    6    7    8    9
Jahr A:    235  254  244  232  245  252  252  267  259
Jahr B:    246  248  264  249  267  266  266  252  271

 

Antwort

Um die Frage beantworten zu können, müssen wir zuerst die passenden Hypothesen aufstellen. Da wir an der Frage, ob die Ernten unterschiedlich ausgefallen sind, interessiert sind, behaupten wir als Nullhypothese, dass sich die Ernten in den beiden Jahren nicht unterscheiden. Wird die Nullhypothese abgelehnt, so wissen wir, dass die Witterung sehr wohl einen Einfluss auf den Ernteertrag hatte (mit einer statistischen Sicherheit von 100*(1-a) Prozent).

Einen wichtigen Punkt darf man bei dieser Fragestellung nicht übersehen: da es sich jeweils um die selben Apfelbäume handelt, sind die Stichproben nicht unabhängig voneinander, sondern paarweise abhängig. Wir müssen also einen Differenzen-t-Test (t-Test für verbundene Stichproben) durchführen.

 

Anleitung
Starten Sie DataLab und laden Sie die entsprechenden Daten. Nach dem Laden der Daten klicken Sie auf den Befehl Mathematik/Tests.... Sie sollten dann folgendes Fenster sehen.

Klicken Sie nun in die erste Spalte, so dass irgendein Feld in der ersten Spalte selektiert ist. Dann markieren Sie die gesamte Spalte in dem Sie den Knopf zum Markieren als Typ A (rot) klicken. Die zweite Spalte wird als Typ B (blau) markiert, in dem Sie irgendeine Zelle der zweiten Spalte selektieren und den entsprechenden Knopf anklicken. Die beiden Jahresernten sind nun rot und blau markiert:

Führen Sie nun den Differenzen-t-Test durch in dem Sie den Knopf "gepaarte Werte" anklicken. Um zu entscheiden, ob die Nullhypothese (H0 = die Differenz der Mittelwerte ist null) abgelehnt werden muss, überprüfen Sie ob der Betrag des berechneten t-Werts (2.4114) größer ist als der kritische t-Wert bei a/2 (für a = 0.05 ergibt sich somit t(a/2) = 2.3060. a/2 ist deshalb zu nehmen, da es sich hier um einen zweiseitigen Test handelt, die kritischen t-Werte aber für einseitige Fragestellungen tabelliert sind.

Die Nullhypothese ist also abzulehnen (bei einem Signifikanzniveau von 5%), was bedeutet, dass die beiden Ernten sehr wohl signifikant unterschiedlich ausgefallen sind. Allerdings ist die Entscheidung, die Nullhypothese abzulehnen, nur knapp zu treffen. Auf einem Signifikanzniveau von a=0.01 könnte man die Nullhypothese schon nicht mehr ablehnen. Den relativ geringen Unterschied der Mittelwerte bei gleichzeitiger Überlagerung der Verteilungen sieht man auch im Boxplot der Testdaten (blaue und rote Box).

Würden wir die selben Daten einem t-Test für unverbundene Stichproben unterziehen, so würden wir keinen signifikanten Unterschied feststellen, da der sich ergebende t-Wert von (Absolutwert von -1.9987) auf einem Signifikanzniveau von a = 0.05 die kritische Grenze für den zweiseitigen Test (2.1199) nicht übersteigt.