Keywords: Data Science,Beratung,Entwicklung,R,Python

Email: info@orges.leka.de, Tel.: 015751078391

Sie haben Unternehmensdaten und wollen mit Hilfe von Data Science ein prädiktives Modell erstellen, wie zum Beispiel die Verkaufspreise verschiedener Produkte anhand von bestimmten Kriterien automatisch berechnen. Die Data Science Entwicklung und Beratung unterteilt sich zumeist in zwei grobe Schritte, die wie folgt zusammengefasst werden können:

Analyse der Daten und Prototyp-Entwicklung in R

In diesem Schritt werden die Daten auf innere Konsistenz (das ist je nach Anwendungsfall sehr unterschiedlich) überprüft. Fehlerhafte Daten oder Daten mit fehlenden Einträgen werden behandelt, bis ein Datensatz entsteht, welchen man mit Machine Learning Algorithmen untersuchen kann. Im nächsten Schritt wird herausgefunden, welche der möglicherweise vielen beschreibenden Kriterien die Zielvariable (z.B. die Verkaufspreise) am meisten beeinflussen und das Ergebnis verbessern. Da es im Machine Learning verschiedene Ansätze gibt das gleiche prädiktive Problem zu lösen (z.B. die Verkaufspreisbestimmung), wird im nächsten Schritt bestimmt, welcher Algorithmus am besten abschneidet. Hat man den für den bestimmten Use Case besten Algorithmus und die besten Kriterien gefunden, so ist der Großteil der Prototyp - Entwicklung abgeschlossen. Falls von Ihnen erwünscht kann hier und in jeder Phase der oben genannten Schritte eine odere mehrere interaktive Web-Dashboards mit R-Shiny entwickelt werden, die verschiedene Szenarien darstellen. Erfahrungsgemäß wird für die Prototyp-Entwicklung R eingesetzt, da es sehr viele Libraries hat und sehr gut für die Datenanalyse auch größerer Datensätze geeignet ist. Außerdem kommt es im ersten Schritt (Prototyp-Entwicklung) nicht so sehr auf das Tool an mit dem man entwicklet, sondern es kommt darauf an die Algorithmen und die Kriterien zu identifizieren, welche im Hintergrund ablaufen und das Ergebnis verbessern.

Produktive Implementierung des Prototyps in Python in Ihre IT-Landschaft

Sind im ersten Schritt die Kriterien und der Algorithmus identifiziert, welche das prädiktive Ergebnis verbessern, gilt es nun diese Erkenntnisse im zweiten Schritt produktiv zu machen. Hier fällt meist die Auswahl des Werkzeuges für die produktive Implementierung auf Python, da es flexibler als R in Ihrer IT-Landschaft eingebaut werden kann und die gleichen Ergebnisse wie R liefert. Wenn Sie zum Beispiel das prädiktive Modell in Ihre IT-Landschaft produktiv integrieren wollen, dann kann man zum Beispiel einen Python-Webservice aufbauen, welcher durch Ihre weiteren Software-Komponenten aufgerufen werden kann. So können Sie flexibel ihre Haupt-Software in einer anderen Sprache als Python schreiben, aber trotzdem den im ersten Schritt entwickelten Machine Learning Algorithmus bequem produktiv nutzen.

(Die Prototyp-Entwicklung und produktive Implementierung können natürlich auch in anderen Sprachen außer R und Python erstellt werden. Das hängt von dem jeweils betrachteten Use-Case ab.)