Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


Modellbildung

Author: Hans Lohninger

Wenn wir Daten erfassen, erwarten wir in vielen Fällen Zusammenhänge zwischen den Daten. Um Schlüsse zu ziehen oder präzisere Aussagen bzw. Vorhersagen über die gemessenen Daten machen zu können, müssen wir ein Modell aufstellen, das die Natur des zugrunde liegenden Zusammenhangs repräsentiert.

Modelle können entweder auf theoretischen Gesetzen oder Prinzipien basieren (wie zum Beispiel der Beziehung zwischen einem gemessenen Spektrum und der Konzentration des Analyten) oder empirisch sein, ohne explizit bekannte Zusammenhänge (wie die Toxizität mancher chemischer Substanzen und ihre chemische Struktur). Die Variablen, die die Basis des Modells bilden, werden als unabhängige Variablen, die Variablen, die durch das Modell geschätzt werden sollen, als abhängige Variablen bezeichnet.

Ein weiterer Aspekt zur Unterscheidung von Modellen ist ihre Linearität oder Nichtlinearität. In manchen Fällen kann man versuchen, nicht lineare Zusammenhänge vor der Modellbildung zu linearisieren oder gleich passende nicht lineare Modelle anzuwenden. Die Verwendung nicht linearer Modelle bedarf größerer Vorsicht als die Verwendung linearer, da sich nicht lineare Modelle leichter an das Rauschen der Daten anpassen.

Ein dritter Aspekt ist die Art der abhängigen Variable, die qualitativ oder quantitativ sein kann. Qualitative Variablen resultieren in Klassifikationsmodellen, quantitative in Kalibrationsmodellen.

Es gibt verschiedene Modelle, die im Laufe der Zeit entwickelt wurden und in deren Namen einige dieser Aspekte deutlich werden:

additive Modelle Additive Modelle sind lineare Modelle. Die unabhängigen Variablen zeigen einen additiven Effekt auf die abhängige Variable.
nicht erwartungstreue Modelle Nicht erwartungstreue Modelle (engl. biased models) sind Modelle, die auf Schätzern basieren, die eine von null verschiedene Differenz zwischen dem erwarteten Wert des Schätzers und dem korrespondierenden wahren Wert zeigen.
kausale Modelle Modelle mit einem kausalen Zusammenhang zwischen unabhängiger und abhängiger Variable.
deterministische Modelle Enthalten keine Zufallselemente (vgl. stochastisches Modell).
lineare Modelle Lineare Modelle sind Modelle, die in ihren Parametern linear sind. Das bedeutet aber nicht, dass diese Zusammenhänge unbedingt einer Geraden folgen müssen.
nicht lineare Modelle Ein nicht lineares Modell ist in den zu schätzenden Parametern nicht linear (genauere Informationen siehe Linearität).
sparsame Modelle Ein sparsames Modell (engl. parsimonious model) ist ein Modell mit möglichst wenigen Parametern (die vorgegebene Güte des Modells muss jedoch erhalten bleiben).
"soft model" Ein "soft model" stützt sich auf intermediäre (latente) Variablen, die oft durch Eigenanalyse der Daten entstehen. Eine unabhängige Variable eines solchen Modells kann nicht einer einzelnen gemessenen Variablen zugewiesen werden, sondern ist eine Kombination von verschiedenen gemessenen Variablen.
stochastische Modelle Ein stochastisches Modell enthält Zufallselemente (im Gegensatz zum deterministischen Modell).

Methoden zur Modellbildung umfassen einen weiten Bereich. Diese Liste enthält die wichtigsten Methoden:




Last Update: 2012-10-08