Harald Weimer

ist Geschäftsführer von Talend Deutschland und Vice President Sales Central Europe. Er hat über 25 Jahre Erfahrung im Vertrieb von Softwarelösungen und war unter anderem bei der USU AG und Iona Technologies tätig.

Vorhersagbarkeit im Sport – schon Realität? Ihr Einsatz bitte!

Was haben eine Underdog-Mannschaft in der amerikanischen Baseball-Liga und Big Data gemeinsam? Harald Weimer von Talend greift anlässlich der Olympischen Spiele tief in die Filmkiste. Was im Sport funktioniert sollte sich auch in der Geschäftswelt bewähren.

Sportübertragungen liefern eine große Menge an Statistiken, die nachträglich zu einem besseren Verständnis des Spiels beziehungsweise Wettbewerbs führen. Anhand dieser Daten kann das Verhalten der einzelnen Spieler beziehungsweise von Athleten oder die Leistung einer Mannschaft in ihrer Gesamtheit analysiert und auf Basis der gesammelten Daten die optimale Strategie entwickelt werden. Der Sport setzt neue Grenzen und stürzt sich mit vollem Elan in die Prognose und Analyse.

Der Film “Die Kunst zu gewinnen – Moneyball” basiert auf einem 2003 veröffentlichten Buch und beschreibt, wie ein Baseballtrainer mit eingeschränktem Budget durch die tiefgründige Analyse der Spielstatistiken das Potenzial seiner Spieler optimal nutzt. Dem Trainer ist der Wert der von ihm gesammelten Daten bewusst und er stellt eine Mannschaft aus den Spielern auf, deren Potenzial nach seinen Analysen hoch, deren finanzieller Wert jedoch unterbewertet ist. Es gelang ihm eine solche Mannschaft zweimal in die Play-offs zu führen.

Im Moment freut sich die ganze Sportwelt auf die Olympischen Spiele in Rio de Janeiro. Kein Wunder, dass jetzt fast zwangsweise verschiedene Fragen in Zusammenhang mit Analysen auftauchen: Ist es in Zukunft vorstellbar, das Ergebnis eines Turniers zu kennen, bevor es überhaupt angefangen hat? Ist es jetzt schon so weit gekommen, dass die Fans nicht mehr mit ihrem Athleten mitfiebern?

Echtzeitanalysen für die Prognosen der Zukunft

Wenn sich das in “Die Kunst zu gewinnen – Moneyball” beschriebene System für Analysen nach dem Spiel respektive Wettkampf bewährt, fehlt ihm aber doch noch eine Dimension für die Aufgaben, die noch vor Ende des Spiels erfolgen müssen: das Bereitstellen von Statistiken und Entwicklungen in Echtzeit. Die Sportwettbüros beispielsweise müssen diese Daten ständig auf den neuesten Stand bringen, um die Werte der Spieler und die Ergebnisse einer Begegnung zu aktualisieren. Dank neuer Analysetechniken wie Hadoop und Spark, die auf dem Machine Learning beruhen, wird es demnächst möglich sein, die Zukunft vorherzusagen.

In der Tat wird Predictive Analytics durch die Kombination aus historischen und Echtzeitdaten Realität. Und das Geheimnis? Die Speicherung von Statistiken über mehrere Jahre und der Leistung im Wettbewerb zur Ermittlung eines Prognosemodells, das aus diesen Daten lernt. Denn ein solches, auf historischen Daten beruhendes Modell trifft nicht nur Prognosen anhand neuer Daten, die in Echtzeit eintreffen, sondern diese Daten bereichern wiederum das grundlegende Modell. Ein gewinnbringender Kreisprozess wird in Gang gesetzt, in dem das Modell während der Lebensdauer des Systems die Treffsicherheit seiner Prognosen fortwährend verbessert.

Anwendungen für alle Tätigkeitsbereiche

Obwohl diese Art an Architektur und Algorithmen komplex sind, vereinfachen moderne Integrationslösungen den Einsatz dieser Daten durch spezifische und an die jeweilige Nutzung angepasste Komponenten. Diese Lösungen tragen, so wie traditionelle wissenschaftliche Forschungsmethoden, ebenfalls zur Industrialisierung der von Data Scientists erstellten Modelle (vor allem dank des Einsatzes einer Machine-Learning-Bibliothek, MLlib, wie Spark Machine Learning Library) bei: vom Labor zur Produktion, von der ersten Probe bis hin zur industriellen Fertigung.

So könnten sich viele Branchen vom Sportsektor inspirieren lassen und ihre eigenen Problemstellungen angehen. Für die Luftfahrt beispielsweise ist es von höchster Bedeutung, die Verfügbarkeit der Flugzeuge zu ermitteln. Sie könnte anhand der Analyse großer Datenmengen die nächsten Wartungszyklen vorhersagen. Dazu würden im Flugzeug Sensoren eingebaut, die ihre Daten während des Flugs übertragen. Im Handel kennen inzwischen alle die Macht der Empfehlungsalgorithmen von Amazon. Und letztlich würden auch weitere Sektoren wie Versicherungen, Banken oder Gesundheitswesen in Bezug auf kundenseitige Problemstellungen von den Erkenntnissen aus Predictive Analytics profitieren.

shutterstock_230939503

Es ist daher demnächst für alle Branchen von höchster Bedeutung – genau wie im Sport – wettbewerbsfähig zu bleiben und sich in Richtung Predictive Analytics zu bewegen. Der erste Schritt dazu ist die Verarbeitung bestehender Daten, so dass daraus Informationen mit großem Mehrwert gewonnen werden, die die strategischen Entscheidungen in Echtzeit unterstützen.

Das Thema Data Governance rückt so ins Blickfeld aller Unternehmen: Ob im Sport oder in anderen Bereichen, Transparenz und Kontrolle der Modelle sind unerlässlich geworden. Die Antworten auf folgende Fragen bestimmen die Zukunft dieses aufkommenden Analysesektors, vor allem im Hinblick auf Vertrauensbildung bei den Konsumenten: Auf welchen Daten beruht dieses Modell? Woher stammen sie? Sind sie korrekt? Wird die geltende Gesetzgebung eingehalten? Kann man in dieses Modell Vertrauen setzen? Wer hat es entworfen? Ist es einseitig oder ausgeglichen?

Und eine letzte Frage: Wenn der Tennisspieler Nadal als Reaktion auf die Dopingvorwürfe gegen ihn gefordert hat, dass sein biometrischer Pass und alle Testergebnisse öffentlich gemacht werden sollen, wird dies bald für alle Sportler der Fall sein?