Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Kendall's Tau-a

Author: Hans Lohninger

M. Kendall hat Ende der 1930er Jahre einen Korrelationskoeffizienten entwickelt, der - ähnlich wie der Spearman'sche Koeffizient - auf einzelne Ausreißer weniger empfindlich ist.

Angenommen, man betrachtet eine Folge von Messwertpaaren xi und yi, deren Zusammenhang bestimmt werden soll, so geht das Kendall-Verfahren von der Annahme aus, dass, wenn man die Paare nach xi sortiert, die Werte yi ebenfalls sortiert vorliegen müssen, falls eine hohe Korrelation vorliegt.

Kendall's Tau-a ist nun ein Maß dafür, wie oft die Folge der Messwerte yi die (nach xi) sortierte Reihenfolge durchbricht. Gibt es keine Abweichung, so ist eine 100%ige positive Korrelation vorhanden, gibt es ausschließlich Abweichungen, so ergibt das eine 100%ig negative Korrelation.

Kendall's Tau-a berechnet sich nach folgender Formel:

wobei n die Zahl der Wertepaare bezeichnet, und P die Zahl der konkordanten (in der Reihenfolge übereinstimmenden) Beobachtungen der Messwerte yi.

Kendall's Tau-a versagt, falls die Messwerte einen hohen Anteil an Bindungen aufweisen. In diesem Fall kann auf Kendall's Tau-b oder Tau-c, oder auf Kruskal's Gamma ausgewichen werden.

Der Vorteil von Kendall's Tau-a gegenüber dem "klassischen" Pearson'schen Korrelationskoeffizienten kann durch folgendes Beispiel verdeutlicht werden. Der im Diagramm unten dargestellte Datensatz besteht aus 28 Wertepaaren, von denen 27 unkorreliert sind und ein Wertepaar einen Ausreißer markiert. Solche mit Ausreißer versehenen Datensätze täuschen immer eine hohe Korrelation vor, wenn man sich auf den Pearson'schen Korrelationskoeffizienten verlässt. Kendall's Tau-a hingegen, ist ähnlich wie der Spearman'sche Koeffizient, immun gegen solche Ausreißer.




Last Update: 2012-10-08