Index
 
Einleitung
Univariate Statistik
Wahrscheinlichkeit
Statistische Tests
Voraussetzungen beim t-Test
verbundene Stichproben
Chi-Quadrat-Test
Test des Korrelationskoeffizienten
Signale
Fouriertransformation
Korrelation
Kalibration
Regression
Datensätze

Signifikanz des Korrelationskoeffizienten

Frage
Das Männchen des Trauersteinschmätzers (Oenanthe Leucura, ein schwarzer Vogel in Spanien und Marokko) hat die seltsame Angewohnheit, dass es während der Paarungszeit vergleichsweise schwere Steine in sein Nest schleppt - jeweils ca. 10-30% des Körpergewichts. In einer Untersuchung wollte man klären, ob das Gewicht der Steine mit der Gesundheit des Vogels zusammenhängt. Die folgende Tabelle zeigt für 21 Männchen das durchschnittliche Steingewicht und den T-Zellen-Response als Maß für die Gesundheit. Klären Sie, ob es einen Zusammenhang gibt, quantifizieren Sie diesen und diskutieren Sie, ob der Zusammenhang signifikant ist (auf einem Signifikanzniveau von 5% und 1%).

    Steinmasse  T-Zellen-
       [g]      Response

       3.33      0.252
       4.62      0.263
       5.43      0.251
       5.73      0.251
       6.12      0.183
       6.29      0.213
       6.45      0.332
       6.51      0.203
       6.65      0.252
       6.75      0.342
       6.81      0.471
       7.56      0.431
       7.83      0.312
       8.02      0.304
       8.06      0.370
       8.18      0.381
       9.08      0.430
       9.15      0.430
       9.35      0.213
       9.42      0.508
       9.95      0.411

Antwort

Um einen ersten Eindruck zu bekommen, ob es einen Zusammenhang gibt und wie stark der sein könnte, wird man im ersten Schritt die beiden Variablen gegeneinander auftragen. Das Streudiagramm (siehe Abb. rechts) zeigt eine moderate positive Korrelation, man sieht auch, dass es offensichtlich keine Ausreisser in den Daten gibt.

Zur quantitativen Beantwortung der Frage werden wir als nächstes den Korrelationskoeffizienten berechnen und testen, ob er bei den vorgegebenen Signifikanzniveaus als signifikant angesehen werden kann.

Die Korrelation ergibt sich zu r = 0.5776, der t-Wert für die NullHypothese [H0: r = 0.0] beträgt 3.0843. Da der t-Wert größer als die jeweilige kritische Grenze (siehe Anleitung unten) ist, ist die Nullhypothese abzulehnen. Das bedeutet, dass sich die gefundene Korrelation signifikant von r = 0 unterscheidet.

Umgekehrt könnte man auch fragen, wie groß die Chance ist, dass sich der gefundene Korrelationskoeffizient zufällig aus einem eigentlich unkorrelierten Prozess ergibt. Dazu berechnet man sich aus der t-Verteilung die Fläche oberhalb des gefundenen t-Werts (0.00305). Da die Prüfung auf Gleichkeit (r = 0) ein zweiseitiger Test ist, ist die Chance gleich 2*0.00305 = 0.0061, oder 0.61%. Anders formuliert, die Chance dass eine Korrelation von 0.5776 zufällig entsteht, obwohl der wahre Wert des Korrelationskoeffizienten null ist, liegt bei ca. 1 zu 164.

Anleitung
Starten Sie DataLab und laden Sie die entsprechenden Daten. Nach dem Laden der Daten klicken Sie auf den Befehl Mathematik/Tests.... Sie sollten dann folgendes Fenster sehen.

Markieren Sie nun die beiden Spalten als Typ A (rot) und Typ B (blau). Am einfachsten geht das, in dem Sie in die Kopfzeile der jeweiligen Variablen klicken (einmal für Typ A, zweimal für Typ B):

Nun rufen Sie den Signifikanztest des Korrelationskoeffizienten auf (Knopf "Korrelation") und geben als Referenzwert, gegen den der gefundene Wert geprüft werden soll, den Wert 0.0 ein. Als Ergebnis erhalten Sie die berechnete Korrelation (0.5776) und den t-Wert für die Überprüfung der Nullhypothese [H0: r = 0.0]. Eine Liste der gängigsten kritischen Grenzen der t-Verteilung ist ebenfalls aufgeführt (siehe Listing unten).

Interpretation des Ergebnises: Die Nullhypothese ist abzulehnen, falls für ein gegebenes Signifikanzniveau die kritische Grenze von ta/2 überschritten wird. In unserem Fall nehmen wir a=0.05 (95%ige Sicherheit) bzw. a=0.01 (99%ige Sicherheit) an. Der gefundene t-Wert überschreitet in beiden Fällen die zugehörigen kritischen Grenzen (t0.025 = 2.09 und t0.005 = 2.86), was bedeutet dass sowohl mit 95%iger als auch mit 99%iger Sicherheit die Nullhypothese abgelehnt werden muss. Da die Nullhypothese aber war, dass r = 0 ist (also keine Korrelation vorliegt), ergibt sich aus der Ablehnung der Nullhypothese, dass die Korrelation von 0.5776 für die 21 Beobachtungen signifikant ist.

Ergebnisse des Signifikanztests des Korrelationskoeffizienten:

Daten des Blocks A:
Zahl der Daten: 21
    Mittelwert: 7.20429
  Standardabw.: 1.70244

Daten des Blocks B:
Zahl der Daten: 21
    Mittelwert: 0.32395
  Standardabw.: 0.09674

gesch. Korrelationskoeff.: 0.5776
Referenzwert: 0.0000
        t-Testgröße: 3.0843
     Freiheitsgrade: 19

kritische t-Werte:
  alpha  t(alpha)
  0.001: 3.5794
  0.002: 3.2731
  0.005: 2.8609
  0.01 : 2.5395
  0.02 : 2.2047
  0.025: 2.0930
  0.05 : 1.7291
  0.1  : 1.3277