Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Histogramm

Author: Hans Lohninger

Histogramme (Balkendiagramme) sind eine effiziente und gebräuchliche Methode, um Verteilungen von kontinuierlichen Variablen zu beschreiben. Im Allgemeinen stellen Histogramme die Häufigkeit des Auftretens einer Beobachtung innerhalb gegebener Intervalle gleicher Breite dar. Histogramme können als eine Art Klassifikation von Daten betrachtet werden. Jeder Datenpunkt wird, abhängig von seinem Wert, in eines der Intervalle sortiert. Das folgende interaktive Beispiel zeigt wie Histogramme berechnet werden.

Eine wichtige Frage ist die Zahl der Intervalle, die für ein Histogramm verwendet wird: wenn die Zahl der Klassen zu niedrig oder zu hoch ist, könnte das Histogramm die Information in den Daten verdecken. Probieren Sie das folgende interaktive Beispiel, um den Effekt der Variation von Intervallgrößen zu sehen. Als Faustregel, wie viele Klassen man am besten verwendet, wird meist einer der folgenden Zusammenhänge verwendet:

nclass~
nclass~ 2
nclass~ 10log10(n)

wobei die letzte Formel für wenige Beobachtungen (<50) ungeeignet ist. Bei nominalen und ordinalen Daten stellt sich die Frage der Klassenbreite nicht, da die Klasseneinteilung sich ohnehin aus der Skaleneinteilung ergibt (einzige Ausnahme wäre eine ordinale Skalierung mit sehr vielen Kategorien, was aber in der Praxis selten vorkommt).

Bei der Darstellung der Histogramme sollte man unbedingt auf Flächentreue achten, da das menschliche Auge leicht zu Fehlinterpretationen neigt, falls die Flächentreue nicht gegeben ist. Außerdem sollte man darauf achten, dass alle Histogrammbalken gleich breit dargestellt werden. Dadurch kann die Häufigkeit direkt der Höhe der Balken zugeordnet werden.

Histogramme sind laut Definition Treppenfunktionen. Eine glattere Alternative zu Histogrammen sind Häufigkeitspolygone.

Wie groß ist Österreich wirklich? Ein kleiner Ausflug in die Untiefen von Wikipedia.

Wie erzeugt man Histogramme in DataLab?


Last Update: 2021-08-15