Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Kovarianz

Author: Hans Lohninger

Es gibt verschiedene Kennzahlen, um die Beziehung zwischen zwei Variablen zu beschreiben; eine davon ist die Kovarianz, eine andere die Korrelation.

Nehmen Sie an, Sie haben zwei Variablen, die in einem bestimmten Ausmaß korreliert sind. Um nun ein Maß für die Beziehung zwischen x und y zu definieren, können Sie versuchen, die Produkte der x- und y-Koordinaten für alle Datenpunkte zu summieren. Bei genauer Prüfung dieses Maßes, ergibt sich jedoch, dass diese Zahl sehr stark von den Absolutwerten der Koordinaten abhängt. Bei Addition eines konstanten Betrags zu allen Koordinaten (was bedeutet, die Daten in der x-y-Ebene zu verschieben, ohne ihre wechselseitige Beziehung zu verändern), wird sich das Maß mit dem Quadrat des addierten Wertes erhöhen. Für ein brauchbares Maß müssen Sie also einen Wert suchen, der unabhängig ist von jeder Verschiebung entlang der Achsen (Invarianz der Translation).

Um das zu erreichen, subtrahieren wir von den x- und y-Werten den jeweiligen Mittelwert, bevor wir den Durchschnitt der Produktterme berechnen:

Dieses Maß nennt man Kovarianz; es ist unabhängig von jeder Translation. Die Kovarianz spielt eine wichtige Rolle in der multivariaten Statistik.

Prüft man die Kovarianz auf ihre Unabhängigkeit von der Skalierung der Daten, stellt man fest, dass sie nicht unabhängig ist. Um die Unabhängigkeit von der Skalierung zu erreichen (Invarianz der Skalierung), muss die Definition der Kovarianz geändert werden. Das resultierende Maß ist als Korrelationskoeffizient bekannt.




Last Update: 2012-10-08