Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Häufigkeit

Author: Hans Lohninger

Häufigkeiten sind die Grundlage vieler Interpretationsansätze und statistischer Verfahren, da sie meist eine zugrundeliegende physikalische/soziale/politische/biologische (oder was auch immer) Realität widerspiegeln. Bei der Beschreibung von Häufigkeiten muss man zwei Fälle unterscheiden:

  • diskrete Werte, die meist nominal oder ordinal skaliert sind
  • stetige Werte, die sehr oft intervall- oder verhälnisskaliert sind
Im Fall von diskreten Werten ist die Zahl der beobachteten Merkmalsausprägungen sehr oft sehr viel geringer als die Zahl der Beobachtungen, während das bei stetigen Werten meist nicht der Fall ist. Ein Beispiel für diskrete Werte wären z.B. die Mathematik-Noten eines Jahrgangs einer Schule. Hat die Schule 120 Schüler in diesem Jahrgang, so entspricht dies 120 Beobachtungen bei nur fünf Merkmalsausprägungen (die Noten 1 bis 5).

Umgekehrt ist die Zahl der Merkmalsausprägungen z.B. beim Körpergewicht ebenso groß wie die Zahl der Beobachtungen (insbesonders wenn man das Körpergewicht auf Gramm genau misst) - es wird kaum Schüler geben, die exakt das selbe Gewicht aufweisen. Man wird also im Fall von stetigen Variablen die Werte in Bereiche (sog. Klassen oder Kategorien) einteilen müssen, um überhaupt interpretierbare Häufigkeiten zu bekommen.(1)

Was versteht man nun unter Häufigkeit?

Unter absoluter Häufigkeit ni versteht man die Zahl der Beobachtungen die eine bestimmte Merkmalsausprägung ai aufweisen, oder die in eine bestimmte Klasse fallen. Die Summe der absoluten Häufigkeiten aller Merkmalsausprägungen bzw. Klassen ergibt die Gesamtzahl N der Beobachtungen:

Σni = N

Relative Häufigkeiten fi ergeben sich durch Normierung auf die Gesamtzahl der Beobachtungen, so dass die Summe der relativen Häufigkeiten 1.0 ergibt (bzw. 100%). Dadurch werden die Häufigkeiten vom Stichprobenumfang unabhängig und vergleichbar.

Häufigkeiten werden im allgemeinen in einer Häufigkeitstabelle oder in einem Histogramm dargestellt. In der Häufigkeitstabelle werden für alle Merkmalsausprägungen ai die zugehörigen absoluten und relativen Häufigkeiten, ni und fi, angegeben:

a1  n1  f1
a2  n2  f2
a3  n3  f3
..  ..  ..

Beispiel: 28 Personen wurden nach ihrer Augenfarbe gefragt; dabei ergaben sich folgende Häufigkeiten:

Augenfarbe abs. Häufigkeit rel. Häufigkeit
braun 14 0.500 (50%)
grau 2 0.071 (7.1%)
blau 9 0.321 (32.1%)
grün 3 0.107 (10.7%)

Der Datensatz weist also bei 28 Beobachtungen vier Merkmalsausprägungen auf, deren Häufigkeiten sich beträchtlich unterscheiden.



(1) Würde man bei stetigen Merkmalen die Beobachtungen nicht in Intervalle zusammenfassen, so würden die relativen Häufkeiten gleich 1/n sein, falls die Zahl der beobachteten Merkmalsausprägungen gleich der Zahl der Beobachtungen ist. Dies würde keinerlei Rückschlüsse auf die zugrundeliegende Verteilung zulassen.



Last Update: 2012-10-08