Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Tabelle der Datensätze

Author: Hans Lohninger

Nachfolgende Tabelle enthält eine Zusammenfassung aller für diverse Übungen benötigten Datensätze. Die meisten Datensätze sind reale Daten aus verschiedenen Quellen (Referenzangaben am Ende dieser Seite). Einige Datensätze enthalten jedoch künstlich erzeugte Daten, die aus ganz bestimmten Gründen erzeugt wurden. Die simulierten Daten sind in durch das Symbol in der rechten Spalte gekennzeichnet. Alle simulierten Datensätze wurden mit Hilfe von DataLab erzeugt.

Dateiname Beschreibung Referenz
ALCOHOL Teilmenge des Datensatzes WINE mit den Alkoholgehalten von zwei Weinsorten.
Mit freundlicher Genehmigung von M. Forina.
BANANAS Eigenschaften von 38 Bananen. Die Bananen wurden vom Autor gewogen, vermessen, gegessen und für gut befunden.
BENZ500 Spektroskopiedaten (NMR) verschiedener Benzinmarken und die dazugehörigen relativen Oktanzahlen.
Mit freundlicher Genehmigung von R. Meusinger.
BODYFAT Prozentsatz an Körperfett, Alter, Gewicht, Größe und zehn andere Körpermaße von 252 Männern. Das Körperfett, ein Maß für die Gesundheit, wird durch Unterwasserwägetechniken abgeschätzt. Passt man das Körperfett an andere Messungen durch multiple Regression an, erhält man eine Möglichkeit, das Körperfett von Männern nur mit einer Waage und einem Maßband abzuschätzen.
Mit freundlicher Genehmigung von G. Fisher.
BOILPTS Siedepunkte und topologische Deskriptoren von 185 chemischen Substanzen.
CANCER Zahl der Darmkrebsfälle in Westdeutschland zwischen 1955 und 1995.
CIGART Künstlicher Datensatz für Klassifikationen, die von INSPECT kreiert wurden. Die Datenpunkte sind so angelegt, dass nur nicht lineare Systeme in der Lage sind, die Daten richtig zu klassifizieren.
COINS Gewicht von 114 Münzen (österreichische 1-Schilling-Münzen) verschiedenen Alters.
Die Münzen wurden gesammelt und gewogen von H. Lohninger und A. Satzinger, Technische Universität Wien, Österreich
ETHANOL NOx-Konzentration in den Abgasen eines experimentellen Ethanolmotors.
EXMPL-A Künstlicher Datensatz, der einige einfache Beziehungen zwischen Variablen zeigt.
FISH1SPECIES Teilmenge des Datensatzes FISHCATCH, die die Beziehung zwischen Gewicht und Größe von Fischen zeigt.
FISHCATCH Körpermaße verschiedener Flussbarscharten.
FLURIEDW Dieser Datensatz enthält geometrische Messungen von 100 echten und 100 gefälschten Banknoten.
Mit freundlicher Genehmigung von H. Riedwyl, Bern, Schweiz.
FREEFALL Simulierte Daten, um Variabilitäten in Datensätzen aufzuzeigen. Eine Stahlkugel wurde aus verschiedenen Höhen fallen gelassen; für jede Höhe wurde das Experiment 100 Mal wiederholt.
HENRYSEM Henry-Konstante chemischer Substanzen zusammen mit molekularen Deskriptoren. Die physikalischen Daten wurden aus Hine et al. entnommen, die molekularen Deskriptoren durch Berechnungen mit TOPIX.
HUMIDIT2 Durchschnittliche relative Luftfeuchtigkeit von 264 Städten in den USA. Der Datensatz enthält die Daten von Juni und September, die am Vormittag und am Nachmittag gemessen wurden. Zusätzlich sind die jährlichen Durchschnitte in den letzten zwei Spalten angegeben.
IRIS Drei Irisarten: Die Pflanzen werden durch vier Variablen beschrieben.
METHANE Dieser Datensatz enthält die Konzentrationen von atmosphärischem Methan, die monatlich über einen Zeitraum von September 1980 bis September 1988 gemessen wurden.
MINWATER Chemische Analyse verschiedener Mineralwassersorten.
MINWATER2 Teilmenge von MINWATER.
MOTE9603 Klimatische Daten der Wetterstation Mote in Florida, USA. Der Datensatz enthält Messungen von 9 meteorologischen Variablen über einen Zeitraum von 10 Tagen, die im März 1996 aufgezeichnet wurden.
Die Daten wurden freundlicherweise von Don Hayward zur Verfügung gestellt.
MOTETIDES Wasserstand bei der Wetterstation Mote in Florida, USA, gemessen im Juli 1998. Die Daten wurden alle 15 Minuten gemessen.
MULTIEST Künstliche Daten, die in einem interaktiven Beispiel verwendet werden.
POLYFIT Künstliche Daten, die eine polynomische Beziehung dritter Ordnung aufweisen.
PRECIPITATION Monatlicher Niederschlag (in Zoll), gemessen von 1961-1990.
REACTTEST Die Reaktionszeit von 9 Personen auf visuelle Stimulation. Das Experiment wurde an zwei Tagen wiederholt; eine Serie wurde vor einem zweistündigen Vortrag, die andere Serie danach erhoben.
STRONTIUM Simulierte Daten, um den Zwei-Stichproben-t-Test zu zeigen.
SUNSPOTS Durchschnittliche monatliche Zahl der Sonnenflecken zwischen 1874 und 1998.
Die Daten wurden freundlicherweise von David H. Hathaway zur Verfügung gestellt.
TRAIN Simulierte Daten, die eine schiefe Verteilung zeigen.
TWOCLASS Künstliche Daten mit zwei Klassen von Messwerten.
WATERRESID Teilmenge von MINWATER.
WINE Chemische Analyse von drei italienischen Rotweinen (Barolo, Grignolino, Barbera).
Daten mit freundlicher Genehmigung von M. Forina
WINEGER Chemische Analyse verschiedener deutscher Weine.
Die Daten wurden freundlicherweise von Klaus Danzer, Friedrich-Schiller-Universität Jena, Deutschland, zur Verfügung gestellt.
WORLDPOP Demografische, soziologische und ökonomische Daten der Länder der Welt (1988).
Die Daten stammen aus einer Reihe von Quellen wie den Vereinten Nationen, der Weltbank und der CIA




Last Update: 2012-10-08