Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Klassifikation vs. Kalibration

Author: Hans Lohninger

Um multivariate Modelle erfolgreich anwenden zu können, muss man etwas über die Struktur der Daten wissen. Abhängig von der Art der Analyse (Klassifikation oder Kalibration) sollte man sich verschiedene Aspekte des Datensatzes ansehen.

Im Falle von Klassifikationsproblemen gilt es drei Fälle zu unterscheiden: (1) Datensätze mit linear separierbaren Gruppen, (2) Daten mit nicht linear separierbaren Gruppen und (3) Gruppen, die überhaupt nicht separiert werden können. In allen drei Fällen sollte sich der Benutzer im Klaren darüber sein, dass es keine einfache Aufgabe ist, zu entscheiden, welcher Fall in einem multidimensionalen Datensatz vorliegt. Auch die Auswahl der am besten geeigneten Variablen hängt stark von dieser Frage ab. Es empfiehlt sich daher, mit den Daten zu experimentieren und zu "spielen", bevor man eine Einteilung vornimmt.

Bei Kalibrationsproblemen gibt es zwei Aspekte, die man bedenken sollte, ehe man ein Kalibrationsmodell entwickelt: (1) Ist ein lineares Modell ausreichend, um die Beziehung zwischen Eingangsvariablen und den Zielvariablen zu beschreiben. Oder (2) benötigt man dazu ein nicht lineares Modell? Diese Entscheidung ist wiederum nicht einfach und wird durch extensives Rauschen in den Daten noch komplexer. Dabei kann eine nicht lineare Beziehung verdeckt werden, so dass es unmöglich ist, ein nicht lineares Modell zu erzeugen.




Last Update: 2012-10-16