Beschreibender Text ataanalytics wird durch Sprachmodelle auch für kleinere Unternehmen möglich. Klassische Methoden wie die logistische Regression oder neue Methoden durch spezialiserte Neuronale Netze können über kostenfreie Softwareapllikationen genutzt werden. Dies kann neue wirtschaftliche Potentiale erschließen und zu einer wirtschaftlichen Optimierung des Ressourceneinsatzes führen.

Theorie: Self Organizing Maps (SOM)

Beschreibender Text

Vor mehr als 40 Jahren hat Teuvo Kohonen seine Self Organizing Maps (SOM) vorgestellt. Eine SOM ist ein unüberwachtes künstliches neuronales Netzwerk, das verwendet wird, um Daten zu visualisieren oder zu clustern. Es projiziert hochdimensionale Daten in eine niedrigdimensionale (oft zweidimensionale) Darstellung, wobei die topologischen Eigenschaften der Eingabedaten erhalten bleiben, d.h. Punkte die im höherdimensionalen Raum beieinander liegen, sind anschließend auch in der 2-dimensionalen Kartenabbildung nahe zusammen. Sie dienen daher zur Mustererkennung und Clusterung von Daten mit vielen Merkmalen. Mehr lesen ...

Theorie: Dimensionsreduktion mit PCA

Beschreibender Text

Die Hauptkomponentenanalyse bzw. Principal Component Analysis (PCA) ist ein wichtiges Werkzeug zur Datenanalyse. Mit ihr lassen sich Daten auf ihre wesentliche Merkmale reduzieren. Zudem können hochdimensionale Daten auf weniger Dimensionen reduziert werden ohne zuviel an Information zu verlieren (Dimensionsreduktion). Anhand eines konkreten Beispiels wird hier das Verfahren gezeigt. Mehr lesen ...

Case Study: Dimensionsreduktion mit SOM

Beschreibender Text

Meist werden PCA-Methoden (=Principal Component Analysis) zur Dimensionsreduktion verwendet. Sie sind sehr schnell berrechenbar und geben Auskunft, wie sich höher-dimensionale Daten sinnvoll auf weniger Dimensionen dartsellen lassen. Selbst organisierenendes Netze (SOM) reduzieren auch die Dimension (meist auf 2), erhalten aber topologische Abhängigkeiten, d.h. sind sich zwei Punkte im höherer Dimension ähnlich, werden sie auch in der 2-Dimensionalen Ebene nahe beieinander dargestellt. SOMs eigenen sich damit zu Clustern von Daten. In dieser Case Study wird dies anhand einer selbstständig erlernten Wetterkarte demonstriert. Ausprobieren ...

Case Study: Selbst organisierende Netze (SOM)

Beschreibender Text

Eine Self Organizing Map (SOM) ist ein unüberwachtes künstliches neuronales Netzwerk, das verwendet wird, um Daten zu visualisieren oder zu clustern. Hier soll eine weitere Anwendungsmöglichkeit von SOMs aus der Optimierung gezeigt werden, die bereits 1988 von Teuvo Kohonen - dem Erfinder der SOM - vorgeschlagen wurde: das Traveling Sales Man Problem. Ausprobieren ...

Theorie: Trendumkehrpotentiale

Beschreibender Text

Zeitreihen können zu Potentialen verdichtet werden. Das hilft sowohl für die Chart-Analyse als auch zur Performance-Messung. Durch die Berechnung von Trendumkehrpunkten können auch Maschine Learning Algorithmen eingesetzt werden.
Mehr lesen ...

Case Study: Trendumkehrpotentiale Beschreibender Text

Trendumkehrpotentiale ermöglichen es, das Potential von Zeitreihen zu ermitteln. Zudem können Trendumkehrpunkte benutzt werden, um über Datenanalyse-Tools (z.B. Neuronale Netze) zukünftige Umkehrpunkte zu prognostizieren. Hier ist ein Beispiel aus der Trading-Welt.
Mehr lesen ...

Theorie: Logistische Regression mit R

R ist eine mächtige Sprache zum Ausführen statistischer Aufgaben. Ein praktisches Beispiel zur Modellierung eines Ratingssystems durch die logistische Regression erläutert dies. Dabei kommen auch SMOTE und andere Varianten zum Einsatz.  
Mehr lesen ...

Theorie: Der Algorithmus von Mangasarian

Beschreibender Text

Optimale Hyperebenen und Support Vector Machines sind wichtige Elemente des maschinellen Lernens. Geht man in die Historie zurück, hat bereits 1965 Olvi L. Mangasarian in seinem Artikel "'Linear and Nonlinear Separartion of Patterns by Linear Programming"' die Trennung beliebiger Punktmengen mittels linearer Programmierung betrachtet. 1990 wurden diese Methoden dann weiterentwickelt und als Neuronales Netz zur Erkennung von Krebszellen angewandt. Insbesondere die massiv gesteigerten Rechnerleistungen machen diesen Algorithmus heute wieder interessant.
Mehr lesen ...