Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.



Übung
Entwurf eines Datensatzes mit Ausreissern

Das Erkennen von Ausreissern ist wichtig, aber manchmal auch recht schwierig. Um Erfahrung mit Ausreissern zu sammeln, sollten Sie zwei Datensätze entwerfen, die folgende Eigenschaften aufweisen:

Datensatz 1: 700 bis 1500 Werte, normal verteilt, keine speziellen Maßnahmen gegen Ausreisser; (Verwenden Sie die Funktion "Gauß" vom DataLab -Befehl Math/Transformation/Single Formula, um den Datensatz zu entwerfen.)
 
Datensatz 2: ungefähr 1000 Werte, nach rechts asymmetrisch; (Hinweis: Verwenden Sie quadrierte Daten einer Normalverteilung mit einem Mittelwert von null, um die asymmetrischen Daten zu erzeugen.) Ändern Sie zwei Werte dieses Datensatzes so, dass einer dieser Werte aus der +/-2.5-Sigma-Reichweite herausfällt, aber innerhalb der +/-4-Sigma-Reichweite verbleibt, und der andere aus der +/-4-Sigma-Reichweite herausfällt.

Wenden Sie den variance/iqr-Ausreisser-Test des DataLab an und erstellen Sie eine Liste der Ausreisser.

Bitte beantworten Sie die folgenden Fragen:

  • Bei wie vielen Werten des Datensatzes 1 haben Sie erwartet, dass sie aus dem 2.5-Sigma-Bereich herausfallen und wie viele Werte lagen tatsächlich außerhalb dieser Grenzen?
  • Entfernen Sie die Ausreisser des Datensatzes 1, die außerhalb des 2.5-Sigma-Bereichs liegen, und wiederholen Sie den Test. Was ist das Ergebnis? Ist es richtig, Ausreisser durch eine schrittweise Vorgehensweise zu eliminieren?
  • Vergleichen Sie die Ergebnisse des 2.5-Sigma-Tests mit denen eines Tests, der auf dem Interquartilsabstand beruht. Erklären Sie den Unterschied in der Empfindlichkeit.


Sie können jetzt direkt zum gehen, um mit den Daten zu experimentieren.



Last Update: 2008-Feb-29