Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


ROC-Kurve

Author: Hans Lohninger

Die ROC-Kurve eines Klassifikators. Die blaue Kurve zeigt die entstehenden ROC-Werte, wenn man die Entscheidungsgrenze des Klassifikators verschiebt.
Die ROC-Kurve (ROC = Receiver Operating Characteristics) ist ein Diagram in dem die Richtig-Positiv-Rate gegen die Falsch-Positiv-Rate aufgetragen wird. Dieses Diagramm veranschaulicht den Kompromiss zwischen den Treffern (richtig positive Klassifizierungen) und den Kosten (falsch positive Klassifizierungen). Ein perfekter Klassifikator erzeugt einen Punkt in der linken oberen Ecke des Diagramms, dieser entspricht einer Trefferquote von 100% (alle positiven Objekte werden als solche erkannt) und einer Falsch-Alarm-Rate von 0% (kein negatives Objekt wird als positiv klassifiziert).

Falls das Klassifizierungsergebnis von einer Entscheidungsschwelle abhängt, kann man die ROC-Werte eines Klassifikators für eine Reihe verschiedener Schwellwerte auftragen. Die entstehende ROC-Kurve (siehe Abbildung rechts) ist ein einfaches und effizientes Werkzeug, um die Eigenschaften des Klassifikators zu charakterisieren. Zum einen kann man die optimale Klassifikator-Schwelle finden, in dem man jenen ROC-Wert sucht, der den größten Normalabstand zur Diagonale des Diagramms aufweist.

Zum anderen ist die Fläche unterhalb der ROC-Kurve (AUC = "area under the ROC curve") ein Maß für die Qualität des Klassifikators. Falls ein Klassifikator keine Entscheidungskraft aufweist, liegt die ROC-Kurve exakt auf der Diagonalen. Je besser die Klassifizierungsfähigkeit des Klassifikators desto höher ist der AUC-Wert. Der AUC-Wert kann als Wahrscheinlichkeit interpretiert werden, dass ein positiver Wert auch tatsächlich als solcher klassifiziert wird.

Hinweis: Da die richtig-positiv-Rate auch Empfindlichkeit genannt wird, und die falsch-positiv-Rate gleich 1-Spezifität ist, wird das ROC-Diagramm manchmal auch "Empfindlichkeit vs. (1-Spezifität)-Plot" genannt.




Last Update: 2012-11-11