Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Übung - Entwurf eines Datensatzes mit Ausreißern

Author: Hans Lohninger

Das Erkennen von Ausreißern ist wichtig, aber manchmal auch recht schwierig. Um Erfahrung mit Ausreißern zu sammeln, sollten Sie zwei Datensätze entwerfen, die folgende Eigenschaften aufweisen:

 

Datensatz 1: 200 Werte, normalverteilt, keine speziellen Maßnahmen gegen Ausreißer; (Verwenden Sie die Funktion "Gauß" vom DataLab -Befehl Math/Transformation/Single Formula, um den Datensatz zu entwerfen.)
 
Datensatz 2: ca. 200 Werte, nach rechts asymmetrisch; (Hinweis: Verwenden Sie quadrierte Daten einer Normalverteilung mit einem Mittelwert von null, um die asymmetrischen Daten zu erzeugen.) Ändern Sie zwei Werte dieses Datensatzes so, dass einer dieser Werte aus der +/-2.5-Sigma-Reichweite herausfällt, aber innerhalb der +/-4-Sigma-Reichweite verbleibt, und der andere aus der +/-4-Sigma-Reichweite herausfällt.

 

Wenden Sie den variance/iqr-Ausreißer-Test des DataLab an und erstellen Sie eine Liste der Ausreißer.

Bitte beantworten Sie die folgenden Fragen:

  • Bei wie vielen Werten des Datensatzes 1 haben Sie erwartet, dass sie aus dem 2.5-Sigma-Bereich herausfallen und wie viele Werte lagen tatsächlich außerhalb dieser Grenzen?
  • Entfernen Sie die Ausreißer des Datensatzes 1, die außerhalb des 2.5-Sigma-Bereichs liegen, und wiederholen Sie den Test. Was ist das Ergebnis? Ist es richtig, Ausreißer durch eine schrittweise Vorgehensweise zu eliminieren?
  • Vergleichen Sie die Ergebnisse des 2.5-Sigma-Tests mit denen eines Tests, der auf dem Interquartilsabstand beruht. Erklären Sie den Unterschied in der Empfindlichkeit.


Sie können jetzt direkt zum  DataLab gehen, um mit den Daten zu experimentieren.




Last Update: 2012-10-08