Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Distanzmatrix

Author: Hans Lohninger

Betrachtet man eine Datenmatrix A mit n Objekten und p Variablen, so ergibt sich die Distanzmatrix D dadurch, dass man für jedes Paar von Objekten die Distanz dazwischen berechnet und in die Distanzmatrix einträgt. Die Distanzmatrix ist eine symmetrische quadratische Matrix der Dimension n n, die in den Diagonalen Nullen enthält (der Abstand eines jeden Objekts zu sich selber ist null).

Die Distanzen können mit verschiedenen Maßen gemessen werden (siehe Distanzmaße), so dass in der Distanzmatrix tatsächliche Abstände in Meter, aber auch topologische Abstände oder entkorrelierte Abstände enthalten können.

Distanzmatrizen bilden für viele Berechnungen eine bequeme Basis, verbrauchen allerdings (falls man viele Objekte in der Datenmatrix hat, n also groß ist) ziemlich viel Speicherplatz, so dass man oft nur Teilmatrizen berechnet.

Anwendung finden Distanzmatrizen u. a. in folgenden Verfahren und Teilgebieten:

  • Die Suche nach kürzesten Verbindungen zwischen zwei Punkten in einem Netz
  • Clusteranalyse
  • Berechnung von quantitiven Struktur-Eigenschaftsbeziehungen (QSPR, QSAR)
  • topologische Indices
  • Substruktursuche
  • Bioinformatik



Last Update: 2012-10-08