Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Der Begriff 'signifikant'

Author: Hans Lohninger

In der Statistik wird sehr oft der Begriff "signifikant" oder "Signifikanz" gebraucht. Nach meiner Erfahrung wird trotzdem gerade dieser Begriff sorglos eingesetzt und oft falsch verstanden. Grundsätzlich kommt das Wort signifikant vom Lateinischen significans (dt. deutlich) und bedeutet nichts anderes als dass ein bestimmter Sachverhalt deutlich zu Tage tritt. Ein kleines Beispiel soll das veranschaulichen:

Beispiel: Angenommen, ein Chemiker analysiert Wasserproben und bestimmt u.a. den Gehalt an Zink im Brunnenwasser. Dabei werden zwei verschiedene Gebiete untersucht, z.B. 10 Brunnen im Norden eines Landes und 10 Brunnen im Süden. Nun berechnet der Chemiker die Mittelwerte sowohl für die Proben aus dem Norden als auch die Proben aus dem Süden und kommt zu folgendem Ergebnis:

Wasserproben im Norden 570.7 µg/l
Wasserproben im Süden 582.1 µg/l

Stellt man die Frage, ob es einen Unterschied zwischen Norden und Süden gibt, so wird man das nur auf den ersten Blick bejahen können. Bei näherer Überlegung ist das nicht mehr so klar, da die beiden Mittelwerte ja von folgenden Einzelwerten stammen könnten:

                  Fall 1:                        Fall 2:

                  Norden    Süden                 Norden    Süden
                  ---------------                 ---------------
Einzelwerte:      571.5     581.7                 566.3     571.5
                  570.8     582.8                 549.5     608.1
                  570.3     580.4                 538.9     544.7
                  570.6     583.3                 588.9     571.7
                  570.4     582.9                 592.5     589.7
                  571.0     579.5                 560.1     588.5
                  571.6     582.8                 572.9     577.7
                  569.4     583.3                 575.1     583.7
                  570.5     583.0                 602.7     561.7
                  570.9     581.3                 560.1     623.7
                  ---------------                 ---------------
Mittelwerte:      570.7     582.1                 570.7     582.1

In beiden Fällen betragen die Mittelwerte jeweils 570.7 und 582.1 - im ersten Fall wird man die Mittelwerte als unterschiedlich ansehen, im zweiten Fall ist dies sehr wohl nicht unmittelbar klar. Betrachtet man die zugehörigen Verteilungen, so wird die Bedeutung des Begriffes signifikant klar: Der Unterschied zwischen den Mittelwerten ist zwar numerisch in jedem Fall gegeben, im ersten Fall ist dieser aber deutlich (=signifikant), im zweiten ist das nicht so deutlich, da die beiden Verteilungen sich beträchtlich überlagern.

Die Bedeutung des Wortes signifikant hängt also in diesem Fall von der Breite der Verteilung der Messwerte ab. Abstrahiert man dieses Beispiel, so kann man signfikant auch so formulieren: ein Ergebnis ist signifikant, wenn die Chance, dass dieses zufällig entstanden ist, gering ist. In unserem Fall ist der Unterschied der Mittelwerte im Fall eins klar, weil sich die zugehörigen Verteilungen nicht überlappen und dadurch die Chance, dass die Werte für den Norden und den Süden aus der selben Verteilung stammen praktisch gleich Null ist. Im zweiten Fall ist diese Chance ganz beträchtlich (nämlich ca. 12%).

Um die Signifikanz eines Ergebnisses präziser angeben zu können, definiert man das Signifikanzniveau, das im Fall eines statistischen Tests die Irrtumswahrscheinlichkeit des Tests bei einem Fehler 1. Art angibt.



Last Update: 2012-10-08