Übung Ähnliche Mineralwassersorten
Ähnliche Beobachtungen in einem Datensatz zu finden, ist ein
Problem, das bei der Datenanalyse häufig auftritt. Es gibt einige
Wege, um Ähnlichkeiten zwischen individuellen Datensätzen aufzudecken. Sie
können entweder Algorithmen der Clusteranalyse verwenden oder auf die visuelle
Überprüfung vertrauen, in dem Sie die Hauptkomponentenanalyse zur
Betrachtung hoch dimensionaler Datensätze heranziehen. (Eine simple
Korrelationstabelle zu verwenden, kann irreführend sein, weil die Korrelation
keine absoluten Werte widerspiegelt).
Verwenden Sie den Datensatz MINWATER , um
(1) die zwei ähnlichsten Mineralwassersorten im Datensatz, (2)
die Sorte, die dem "Gasteiner"-Mineralwasser am ähnlichsten ist und (3)
die zwei unähnlichsten Mineralwassersorten zu finden.
Was sollte man mit den fehlenden Werten tun?
Sie können direkt zum gehen, um mit den Daten zu experimentieren.
|