"Wer aufhört, besser zu werden, hat aufgehört, gut zu sein."
Philip Rosenthal

Bei Heringer Consulting trifft Expertise auf Menschen. In der Zusammenarbeit unterscheiden wir nicht zwischen unserem Team und unseren Kunden. Wir arbeiten immer professionell, wertschätzend und auf Augenhöhe. Das heißt für uns Erfolg. Und der gibt uns wie Ihnen Recht.

DATA TALENT AT YOUR SIDE
Vorhersage von Vertragsbeendigungen anhand eines Machine Learning Modells

Im Projekt "Vorhersage von Vertragsbeendigungen anhand eines Machine Learning Modells" im Gesundheitswesen wurden wesentliche Fortschritte erzielt, um zukünftige Vertragsbeendigungen vorherzusagen. Die notwendige Entwicklungsinfrastruktur wurde eingerichtet, einschließlich der Installation einer Integration Runtime und der Erstellung von Azure Data Factory, Azure Blob Storage, Azure Databricks und Azure Key Vault im Azure Portal. Die agile Entwicklung erfolgte nach dem Scrum-Verfahren mit einwöchigen Sprintintervallen. Durch Absprache mit den Stakeholdern wurden die Ziele formuliert und potenziell relevante Einflussgrößen für das Modell ermittelt. Die relevanten Daten wurden auf einem Microsoft SQL Server verarbeitet. Eine Azure Data Factory-Pipeline wurde erstellt, um Daten aus dem On-Premise SQL Server über die Integration Runtime und Azure Blob Storage in das Azure Databricks File System zu übertragen. Die Daten wurden explorativ analysiert und für die Verwendung durch das Machine Learning Modell in Azure Databricks aufbereitet. Transformationsschritte zur Datenaufbereitung wurden in die Azure Data Factory-Pipeline integriert. Ein Machine Learning Modell (XGBoost) wurde trainiert und durch automatisierte Feature Selection und Hyperparameter Tuning optimiert. Das trainierte Modell wurde in Azure Databricks mit MLflow bereitgestellt. Die Analyse- und Vorhersageergebnisse wurden in Azure Databricks Notebooks (mit Python) und Power BI visualisiert. Der Quellcode wurde mit Azure DevOps verwaltet. Dabei kamen Technologien wie Azure Cloud, ETL, Azure Data Lake (Gen 2), Azure Data Factory, Azure Databricks, SQL, JSON, Matplotlib, Powerpoint, Python, PySparkSQL, Azure Key Vault, pandas, Seaborn, SCRUM, sklearn, XGBoost, Power BI, Azure DevOps, SQL Server Management Studio (SSMS), Apache Spark und MLflow erfolgreich zum Einsatz.

Dieses Projekt hat dazu beigetragen, fundierte Vorhersagen zu Vertragsbeendigungen zu liefern und wertvolle Erkenntnisse im Gesundheitswesen zu gewinnen.