Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Diskrimination und Klassifikation

Author: Hans Lohninger

Diskriminanztechniken sind Methoden, die gemessene Variablen verwenden, um Beobachtungen in verschiedene Klassen einzuteilen. Der wichtigste Unterschied zwischen multiplen Regressionsmodellen und Diskriminanzmethoden ist der, dass die abhängige Variable eine Art Klassenzahl ist. In vielen Fällen können die Beobachtungen Mitglieder von nur zwei möglichen Fällen sein, was das Diskriminanzproblem zu einer binären Klassifikation vereinfacht. Ein Beispiel wäre ein Gut/Schlecht-Test bei einer Qualitätsinspektion.

Hier eine kurze Liste der wichtigsten Klassifikationstechniken:

Ein Klassifikationsproblem kann man geometrisch interpretieren: Suchen Sie dazu eine passende Trennlinie (oder -kurve) zwischen zwei oder mehreren Gruppen von ähnlichen Objekten. Die Art der Teilungslinie hängt vom verwendeten Modell ab. Ein neuronales Netzwerk zum Beispiel könnte eine nicht lineare Diskriminanzfunktion erzeugen, während eine LDA nur lineare Trennflächen erzeugen kann. Das impliziert natürlich, dass nicht jede Methode für ein Problem gleich gut geeignet ist. Das Klassifikationsproblem, das unten dargestellt ist, könnte leicht von einem neuronalen Netz gelöst werden, während zum Beispiel die LDA versagen würde.





Last Update: 2012-10-14