Case Study: SOM und Wetter
Vorgehen
Die Wetterdaten von Dezember 1827 bis 1950 wurden auf Monatsdaten komprimiert, basierend auf Höchsttemperatur, Tiefsttemperatur, Tagesmitteltemperatur und Niederschlagsmenge. Durch Durchschnittsbildung und Normierung entstanden 1385 Datensätze mit je vier Feldern. Die 4-dimensionalen Daten wurden anschließend auf eine 2-dimensionale Karte mit 10x10 hexagonal angeordneten Neuronen abgebildet. Während des Lernprozesses wird jeweils ein zufällig ausgewählter Datensatz genutzt, um die Gewichte des passenden Neurons und seiner Nachbarn zu aktualisieren.
Zur grafischen Darstellung werden jedem Datensatz die zugehörigen Gewinnerneuronen zugeordnet. Jedes Neuron erhält ein Label basierend auf dem häufigsten Monat der verknüpften Datensätze. Die farbliche Darstellung unterscheidet Sommermonate (Rot), Wintermonate (Blau) sowie Frühling- und Herbstmonate (Grün).
Lernen
Insgesamt wurden 600.000 Simulationen durchgeführt, wobei die Berechnungszeit auf einem PC ohne GPU etwa 155 Sekunden betrug. Das nachfolgende Video zeigt den Lernprozess im Zeitraffer (Faktor 7). Für die Initialisierung der Gewichte wurde eine PCA (Hauptkomponentenanalyse) verwendet (Startbild des Videos).
Interpretation
Jede hexagonale Einheit (Neuron) repräsentiert einen Bereich der Wetterdaten. Die obere Zahl im Hexagon zeigt die Anzahl der zugeordneten Datensätze. Das mittige Label gibt den häufigsten Monat dieser Datensätze an, und der Prozentsatz am unteren Rand zeigt die Relevanz des Labels an. Die finale Karte visualisiert die Wetterverteilung der Jahre 1827 bis 1950. Beispielsweise befinden sich die Wintermonate rechts unten, die Sommermonate oben, und die Übergangsmonate dazwischen. Der Algorithmus hatte keine Kalenderdaten (unüberwachtes Lernen), sondern die reinen Wetterdaten ohne Labeling.
Ausprobieren
Beispiel: Wird das Jahr 2023 analysiert, zeigt die Karte, wie dieses Jahr im Vergleich zu den historischen Daten (1827-1950) einzuordnen ist. Dabei können Verschiebungen in der zeitlichen Zuordnung der Monate festgestellt werden. So wird beispielsweise der September 2023 dem August in der langfristigen Datenreihe zugeordnet, d.h. der September 2023 war so, wie eigentlich ein Augustmonat sein müsste. Der Janaur 2023 war entsprechend eher ein November und der Dezember eher ein März. Gibt man einen Datenbereich (z.B. 2000 bis 2023) an, so sieht man eine eindeutige Verschiebung der Wintermoante Richtung Herbst/Frühling und der Herbst/Frühlingmoante Richtung Sommer.
