Klinische Studien, Biobank-Daten, elektronische Krankenakten, Lieferketten- und Produktionsdaten: In der Pharmabranche stehen unendlich viele Daten bereit. Sie alle haben das Potenzial, uns schneller an das Ziel zu bringen, Menschen und Tieren zu helfen. Mit ihnen können wir potenziell die Entstehung von Krankheiten besser verstehen, Heilungsmöglichkeiten schneller finden, die Medikamentenentwicklung beschleunigen und bessere Behandlungsmöglichkeiten schneller für mehr Patientinnen und Patienten zugänglich machen.
Wie für viele Unternehmen sind Data Science und Künstliche Intelligenz (KI) inzwischen auch für das forschungsgetriebene, globale Biopharmaunternehmen Boehringer Ingelheim von zentraler Bedeutung. Ziel ist es, mit Data Science bessere Entscheidungen entlang der gesamten Wertschöpfungskette zu treffen, von der frühen Wirkstoffentdeckung und klinischen Studien bis hin zu Produktion und Vertrieb – und damit letztlich das Leben der Patienten zu verbessern. Das gilt natürlich auch für unsere tierischen Patienten in unserer Tiergesundheitssparte.
Damit Unternehmen durch datengestützte Entscheidungen besser werden, sind zwei Faktoren zu beachten: Die technologische Seite, die dafür sorgen muss, dass Daten ausgewertet werden können, um übergreifend Erkenntnisse aus ihnen zu erhalten. Und eine datenbasierte Unternehmenskultur, in der die Mitarbeitenden über das Know-how und das Mindset verfügen, ihre Arbeit durch den richtigen Einsatz von Technologie zu verbessern.
Um sie sinnvoll zu nutzen, müssen die wertvollen Informationen aus den Daten jedoch erst freigelegt werden. Um eine Infrastruktur sowie Prozesse zur effektiven Datennutzung zu schaffen, hat Boehringer Ingelheim die digitale Plattform Dataland entwickelt, unterstützt von Capgemini. Seit 2022 ist sie in Betrieb. Das End-to-End-Datenökosystem führt Daten aus allen Unternehmensbereichen zusammen und macht sie auffindbar, zugänglich, interoperabel und wiederverwendbar. Über eine Self-Service-Lösung stellt Dataland sie allen Mitarbeitenden unmittelbar zur intuitiven Nutzung bereit, zum Beispiel für Simulationen oder Datenanalysen.
Dataland optimiert die Struktur von Datensätzen und berücksichtigt dabei ihre Größe. Bei externen Daten kann diese bis zu mehreren Petabytes betragen. Weil sie alle technischen Möglichkeiten bietet, um diese großen Datenmengen zu verarbeiten, setzt Boehringer auf eine Cloud-Struktur. Bei deren Implementierung arbeitete das Unternehmen mit Amazon Web Services (AWS) zusammen.
Um alle internen, aber auch externen Datensätze strukturiert zu katalogisieren und verfügbar zu machen, hat Boehringer Ingelheim Dataland als modulares System mit einem federierten Data Domain Konzept aufgesetzt. Dies unterscheidet die Plattform von herkömmlichen Modellen sowie von immer noch stark silo-orientierten Modellen von Mitbewerbern. Alle gesammelten Daten werden einer Datensicherheits- und Compliance-Prüfung unterzogen und durch modernste Sicherheitsmaßnahmen geschützt. Innerhalb von Dataland ist zudem eine gute Data Governance über die verschiedenen Data Domains wichtig. Sie muss die Compliance-Richtlinien des Unternehmens beinhalten, aber trotzdem alltagstauglich sein. Nicht jeder muss alle Zugangs- und Zugriffsrechte besitzen, gleichzeitig darf kein Flaschenhals entstehen. Mittels der modularen Data-Plattform-Architektur vereinfacht Boehringer Ingelheim diesen komplexen Prozess.
Boehringers IT-Infrastruktur umfasst rund 1000 Systeme, die an Dataland potenziell angeschlossen werden. Das reine Datenvolumen bei Analysen ist bei Initiativen wie Dataland heutzutage nicht mehr die zentrale Herausforderung. Die Komplexität liegt vielmehr darin, ein einziges Informationsmodell zu etablieren, um die Daten tatsächlich vergleichbar zu machen. Ebenso wichtig sind die Verwendung einer einheitlichen Terminologie und einer einheitlichen Struktur der Daten.
Dataland soll bei Boehringer Ingelheim eine datengetriebene Denkweise und Arbeitskultur etablieren. Die neuen Möglichkeiten der Datenverarbeitung und -analyse bedingen auch neue Fragestellungen, damit auch tatsächlich neue erweiterte Ergebnisse entstehen. Mit dem Datenökosystem allein ist es allerdings nicht getan, erfolgreich zu transformieren. Hierfür ist nicht nur die technische Grundlage entscheidend: Mitarbeitende benötigen die entsprechende Data Literacy, um gewinnbringende Entscheidungen aus den Daten ableiten zu können.
Für die gezielte Weiterbildung sowie den kulturellen Wandel hat das Unternehmen 2021 die Data Science Academy ins Leben gerufen. Die globale Schulungsakademie kooperiert mit verschiedenen Universitäten und bietet für unterschiedliche Zielgruppen auf allen Hierarchieebenen einen Mehrwert für den erfolgreichen Einsatz von Data Science. Zum Angebot der Data Science Academy gehören deshalb maßgeschneiderte Fortbildungsmöglichkeiten in den Bereichen Data Science und Engineering, Identifizierung von Datenmöglichkeiten, Management von Datenprojekten sowie eine datengetriebene Kultur. All das angepasst für den jeweiligen Kenntnisstand, vom erfahrenen Data Scientist bis zum Neuling. Das Angebot basiert auf Classroom-Trainings für unterschiedliche Zielgruppen, unterteilt in Leistungsstufen. Unterstützt wurde Boehringer Ingelheim dabei von Capgemini. Die Schulungen werden bei Bedarf durch Coursera- oder LinkedIn-Kurse ergänzt. Für sehr spezialisierte Trainings greift die Academy auch auf externe E-Learning-Angebote zurück.
Technische Fähigkeiten werden für Business-Prozesse zukünftig immer wichtiger werden. Entsprechend müssen wir auch hier unsere Kollegen unterstützen und ihnen entsprechende Tools und Fertigkeiten an die Hand geben. Aufgrund der Weiterqualifizierung können Mitarbeitende innerhalb des Unternehmens zusätzliche Rollen ausfüllen oder in ganz neue Bereiche wechseln. Die Academy ermöglicht so beispielsweise auch weniger ausgebildeten IT-Fachkräften oder fachspezifischen Personal mittels IT-Fortbildungen, selbst Code zu schreiben.
Dataland wird nicht über Nacht und auf einmal gebaut, sondern wächst iterativ mit jedem weiteren Use-Case. Ein paar der bisherigen Projekte verdeutlichen, was so möglich wird: Next Best Action (NBA) AICER of Human Pharma Regions war die erste Anwendung von Dataland, die in der Praxis eingesetzt wurde. Sie unterstützt den Vertrieb und das Marketing, indem Dataland auf verschiedene Datenquellen zurückgreift und zum Beispiel Anrufpläne der Mitarbeitenden optimiert. Die Dataland-Anwendung „Pegasus Site Identification“ findet die optimalen Standorte für eine klinische Studie, indem sie Leistungskennzahlen der infrage kommenden Länder analysiert und die Patientenrekrutierung simuliert. So wird der zeitliche Ablauf der Studie besser planbar.
Mit dem „Healthcare Data Analytics and Disease Translational Accelerator“ entwickelt Boehringer Ingelheim eine anwenderfreundliche Plattform, die Biobankdaten zur Verfügung stellt. Diese digitalen Datenbanken echter, anonymisierter Patientendaten erfassen beispielsweise Eigenschaften von Gewebeproben aus elektronischen Patientenakten. Diese externen Quellen kann Boehringer Ingelheim mit Dataland erstmals vollumfänglich optimal nutzen, um den Entwicklungsprozess neuer, stärker personalisierter Medikamente zu beschleunigen.
Bei der Umsetzung der Use Cases unterstützt die Abteilung Central Data Science innerhalb von Boehringer Ingelheim als ein Teil von Dataland. Von der ersten Idee für eine datengetriebene Applikation bis zur Beschaffung der Lösung und zum Rollout der Lösung arbeiten Data Scientists, Technologie- und Ideation-Experten sowie Designer mit Mitarbeitenden in den Fachabteilungen zusammen, etwa Forschern, Prozessexperten oder anderen Data Scientists. Ausgehend von einer ersten Idee oder auch einem Problem, das alle Mitarbeitenden an die Abteilung herantragen können, prüft Central Data Science die Machbarkeit und anschließend eventuelle Lösungsansätze, um sie bedarfsorientiert zu skalieren und auszurollen.
Andreas Henrich
ist Corporate Vice President IT Enterprise Data & Platforms, Boehringer Ingelheim.
Bau- und Fertigungsspezialist investiert in die S/4HANA-Migration und geht mit RISE WITH SAP in die…
Trends 2025: Rasante Entwicklungen bei Automatisierung, KI und in vielen anderen Bereichen lassen Unternehmen nicht…
DHL Supply Chain nutzt generative KI-Anwendungen für Datenbereinigung und präzisere Beantwortung von Angebotsanforderungen (RFQ).
Marke mtu will globale Serviceabläufe optimieren und strategische Ziele hinsichtlich Effizienz, Nachhaltigkeit und Wachstum unterstützen.
IT-Infrastruktur-Trends 2025: Open-Source-Projekte sowie aufwändige regulatorische und Pflichtaufgaben werden das Jahr prägen.
IT-Systeme werden vor Ort in einem hochsicheren IT-Safe betrieben, ohne auf bauliche Maßnahmen wie die…