Mangel an KI-reifen Daten gefährdet KI-Projekte

Gartner: 63 Prozent der Unternehmen nutzen entweder falsche Datenverwaltungspraktiken für KI oder wissen nicht, ob sie überhaupt welche haben.

Gartner prognostiziert, dass Unternehmen bis 2026 60 Prozent der KI-Projekte aufgeben werden, die nicht durch KI-fähige Daten unterstützt werden. Im Vorfeld des Gartner Data & Analytics Summit vom 3. bis 5. März in Orlando, haben wir mit Roxane Edjlali, Senior Director Analyst bei Gartner,  darüber gesprochen, wie KI CIOs und Chief Data and Analytics Officers (CDAOs) dazu zwingt, ihr Datenmanagement zu ändern, um KI in ihren Unternehmen zu unterstützen und zu implementieren.

Frau Edjlali, wie können IT-Verantwortliche KI-fähige Datenstrategien in bestehende Datenverwaltungssysteme integrieren?

Roxane Edjlali: Wir empfehlen, dass Unternehmen auf ihr bestehendes Datenmanagement aufbauen, indem sie iterativ KI-spezifische Dateninnovationen hinzufügen, die das Datenmanagement erweitern und verbessern, um neue Anwendungsfälle, wie GenAI, zu unterstützen. Dazu könnten unter anderem Vektordatenspeicher, Chunking, Sampling, Embedding und die Integration von Retrieval-Augmented Generation (RAG) gehören.

Warum müssen die Daten für KI angepasst werden?

Roxane Edjlali: KI-fähige Daten funktionieren nicht nach dem Prinzip “one and done”.  Traditionelle Datenverwaltungsvorgänge sind zu langsam, zu strukturiert und zu starr für KI-Teams. Darüber hinaus ist die Verwendung von Daten im traditionellen Datenmanagement nicht gut dokumentiert, und die Daten werden oft in Silos in verschiedenen Repositories, mehreren Systemen und Plattformen gesammelt. Den Unternehmen fehlen die erforderlichen Verfahren und Metadaten, um die Eignung von Daten für KI zu bewerten. Daher muss die Datenmanagement-Infrastruktur auf der Grundlage bestehender und künftiger KI-Anwendungsfälle ständig verbessert werden. Ein  Unternehmen muss daher eine KI-fähige Datenpraxis entwickeln und fortlaufend in die Bereiche Metadaten-Management, Datenbeobachtung, D&A und KI-Governance investieren.

Welche Schritte stellen sicher, dass Daten KI-fähig sind?

Roxane Edjlali: Zunächst muss definiert werden, was KI-fähige Daten sind. Die Daten müssen für den Anwendungsfall repräsentativ sein, mit allen Mustern, Fehlern und Ausreißern, die zum Trainieren oder Ausführen des KI-Modells für den spezifischen Anwendungsfall erforderlich sind. Der Nachweis der KI-Fähigkeit der Daten ist ein Prozess, der auf der Verfügbarkeit von Metadaten zur Abstimmung, Qualifizierung und Steuerung der Daten beruht.

CIOs und CDAOs sollten verschiedene Datenquellen für KI-Anwendungsfälle in Betracht ziehen, einschließlich interner oder externer Datenquellen. Sie müssen Data-Governance-Anforderungen für KI identifizieren, um die Risiken von Verstößen gegen rechtliche Anforderungen und die unethische Nutzung von KI-Produkten zu verhindern. CDAOs sollten dafür eng mit Rechts- und Unternehmensverantwortlichen zusammenarbeiten, um Fragen zu beantworten, ob die Daten zum Beispiel über viele Nutzer und Anwendungen hinweg interoperabel sein werden, wie sensible Daten automatisch erkannt werden können und wie diese Daten geschützt werden sollten, wenn sie in KI-Modelle eingespeist werden.

Welche Rolle spielen dabei Metadaten?

Roxane Edjlali: Metadaten sollten von passiv zu aktiv gewandelt werden, um Intelligenz aufzubauen und eine kontinuierliche, iterative Verbesserung und Automatisierung zu ermöglichen. CDAOs sollten Metadaten entdecken, anreichern und analysieren und aus den Ergebnissen eine Empfehlung ableiten.

Es sollten Datenpipelines vorbereitet werden, um ein KI-Modelldatensatz für Trainingszwecke sowie für eine Live-Dateneinspeisung in KI-Produktionssysteme auf der Grundlage der erfassten Anforderungen aufzubauen. Und schließlich sollten CDAOs die Daten, die für das Training von KI-Modellen zur Verfügung stehen, testen und überwachen, um die Modelle zu optimieren. Sie können dafür DataOps und Datenbeobachtungsprozesse implementieren, um Datenmuster und -änderungen zu verfolgen und die Datenanforderungen bei Bedarf anzupassen.

Wie lassen sich KI-fähige Daten verwalten?

Roxane Edjlali: In dem Maße, in dem Unternehmen von KI-Piloten zu voll funktionsfähiger KI übergehen, wird der Einsatz von kollaborativen und bereichsübergreifenden Strategien zur Verwaltung und Steuerung von KI im gesamten Unternehmen entscheidend für den weiteren Erfolg. Dafür eignet sich zum Beispiel Enterprise Governance of AI (EGoAI), eine flexible Methode, die verschiedene Governance-Bereiche kombiniert.

Die Governance-Reise beginnt oft auf der Führungsebene, indem eine virtuelle Ebene von Entscheidungsfindungspraktiken über bestehende IT-, D&A- und Risiko-Governance-Bereiche hinweg eingerichtet wird. Wenn ein Unternehmen beispielsweise KI einsetzen möchte, um das Kundenerlebnis zu verbessern und das Wachstum zu fördern, beginnt der Entscheidungsprozess auf der Führungsebene. Der CIO oder CDAO formt dann die Governance-Reaktion, klärt Risiko, Wert und Kosten und orchestriert die notwendigen Entscheidungen, um die Erwartungen der Geschäftsführung zu erfüllen.

 

Roxane Edjlali

ist Senior Director Analyst bei Gartner.

 

 

 

 

Anzeige

Silicon - IT Deep Dive
sponsorisé
Deutsche Telekom: KI im Mittelstand