Predictive Analytics: Intelligente Prognosen mit Big Data

    An welchen Standorten lohnen sich Investitionen am meisten? Wie erkennt man Betrug, bevor größerer Schaden entsteht? KI und Big Data erlauben immer bessere Vorhersagen. Was datengestützte Prognosen leisten können.


    Predictive Analytics nutzen Daten aus der Vergangenheit, um Trends zu erkennen und zukünftige Ereignisse vorauszusagen. Spezialisten entwickeln dafür mathematische Modelle, die zahlreiche Bedingungen gleichzeitig berücksichtigen. Am besten lässt sich das an konkreten Beispielen erklären:
     

    Aktionen, wo sie wirken. Eine Sportstudio-Kette will ermitteln, welche Mitglieder wahrscheinlich bald abspringen. Daten aus der Vergangenheit zeigen: Wer seit einem halben Jahr weniger als zweimal monatlich trainiert und im Internet nach Hantelbänken recherchiert, kündigt überdurchschnittlich häufig. Diese Mitglieder lassen sich möglicherweise mit einem Sonderangebot halten. Nach ähnlichem Prinzip können Unternehmen auch Neukunden gewinnen. Rabattaktionen lassen sich also gezielter ausrichten, Streuverluste verringern.
     

    Überschuss und Knappheit vorhersehen. Wind- und Solarkraft produzieren wetterabhängig mehr oder weniger Strom. Große Netzbetreiber können mithilfe von Datenmodellen vorausberechnen, wann und wie sie eingreifen müssen, um das System stabil zu halten. Sensordaten erfassen, wie stark Leitungen und Anlagen ausgelastet sind. Verknüpft mit Wetterprognosen und Fahrplänen konventioneller Kraftwerke erhalten Betreiber ein Gesamtbild. Sie können dann beispielsweise überschüssigen Strom aus einer Region in andere Gebiete verteilen.

    Auch im Gesundheitswesen lassen sich mit Predictive Analytics Kapazitäten besser planen: Daten über die bisherige Auslastung von Kliniken, verknüpft mit demografischen Prognosen, Informationen über Volkskrankheiten, neue Therapien und andere Faktoren legen nahe, in welche Standorte die Betreiber künftig mehr oder weniger investieren sollten.
     

    Betrug vorbeugen. Manche Konsumenten nutzen Onlineshops wie kostenlose Mietservices, indem sie Waren verwenden und nach einigen Tagen zurückschicken. Datenanalysen können vor solchem Betrug früh warnen: Werden vor großen Sportereignissen Fernsehgeräte bestellt und danach retourniert? Ordert eine Person häufig Kleidungsstücke und sendet sie auf den letzten Drücker zurück? Fallen derartige Muster auf, kann ein Händler diesen Kunden zum Beispiel nur noch kostenpflichtige Retouren anbieten.
     

    Predictive Analytics stützen sich unter anderem auf Künstliche Intelligenz (KI): Spezielle Programme sind in der Lage, Zusammenhänge in großen Datenmengen zu entdecken. In das statistische Modell fließen dann sämtliche Merkmale ein, die für das künftige Ereignis relevant sind. Diese Faktoren können sich mit der Zeit wandeln: je nach Saison etwa, oder weil sich ganze Märkte verändern. Die KI-Systeme sind so programmiert, dass sie dazulernen und neue Beziehungen zwischen vorliegenden Informationen erkennen.

    Oft verfügen Unternehmen bereits über viele Daten, die sie für Prognosen benötigen: über Rohstoffpreise, Lieferprozesse und Kundenvorlieben zum Beispiel. Was noch fehlt, können sie entweder selbst erheben oder zukaufen. Sollen verschiedene Abteilungen Daten beisteuern, braucht man dafür eine gemeinsame technische Basis. Unter Umständen muss das Unternehmen erst seine Datenbanken harmonisieren. Und auch die eigentlichen Daten sind in der Regel nicht sofort einsatzfähig. Sie aufzubereiten und bereitzustellen, nimmt in den meisten Fällen mehr Zeit in Anspruch, als das eigentliche Modell zu entwickeln.

    Was eine Prognose leisten soll und welche Variablen am Ende einfließen, entscheidet kein Algorithmus. Spezialisten erarbeiten das am besten gemeinsam mit Verantwortlichen aus den beteiligten Geschäftsbereichen. Wenn eine Organisation erstmalig Predictive Analytics einsetzt, sind die Erwartungen zu Beginn nicht immer realistisch. Datenbasierte Vorhersagen treffen nur mit einer gewissen Wahrscheinlichkeit zu. Zum Projektmanagement gehört daher, Stärken und Grenzen der Modelle aufzuzeigen und Anwender darin zu schulen, Ergebnisse sinnvoll zu interpretieren. Zu bedenken sind unter anderem die folgenden Aspekte:
     

    Krisenhafte Ereignisse. Trends aus der Vergangenheit lassen sich nicht einfach fortschreiben, wenn sich die Markt- oder Produktionsbedingungen plötzlich ändern. Die Corona-Pandemie ist dafür ein drastisches Beispiel.
     

    Datenschutz. Welche Informationen ein Unternehmen sammeln darf, wie sie zu anonymisieren sind, wie lange sie gespeichert werden dürfen, all das kann Einfluss auf die Analysen haben. Personenbezogene Daten sind sorgfältig zu verwalten und zu schützen.
     

    Delegieren von Entscheidungen. Zu unterscheiden sind deskriptive und präskriptive Analysen. Deskriptive Modelle liefern lediglich bessere Grundlagen für Entscheidungen, empfehlen jedoch keine der möglichen Handlungsoptionen. Dies leisten sogenannte präskriptive Analysen, die sich allerdings nur für bestimmte Themen anbieten, beispielsweise um Rohstoffpreise zu berechnen.