Categories: Data

Rohdaten-Aufbereitung in der Cloud

Google stellt den Service Google Cloud Dataprep vor. Die Lösung soll Anwendern ein Tool für die Aufbereitung von Rohdaten über die Cloud bereitstellen. Als Nutzeroberfläche kommt bei Google Cloud Dataprep die Oberfläche von von Trifacta und dem Photon Compute Framework zum Einsatz. Cloud Dataprep ist zudem in Google Cloud Dataflow nativ integriert. Das ermöglicht eine serverlose, autoskalierende Ausführung verschiedener Datenaufbereitungsverfahren.

Der neue Google-Service ermöglicht es Daten-Analysten, in der Google Cloud Platform-Umgebung verschiedenartige Datasets für ein breites Spektrum an Downstream-Einsätzen, wie etwa Analytics und maschinelles Lernen, intuitiv zu erkunden und aufzubereiten. So können Anwender auch betriebliche Abläufe optimieren oder neue Möglichkeiten für Geschäftsmodelle erkunden.

Einige Anwender geben an, dass bei Daten-Analysen bis zu 80 Prozent des zeitlichen Aufwands auf die Vorbereitung der Daten verwendet werden, wie Fausto Ibarra, Director Product Management für Google Cloud Platform in einem Blog erklärt.

Das Feautre ‘Interactive Exploration’ mit Google Cloud Dataprep zeigt mögliche Ergebnisse an und führt den Nutzer über Vorschläge schneller zu Ergebnissen. (Bild: Trifacta)

“Immer mehr Unternehmen verlagern Analytics-Workloads in die Cloud”, kommentiert Adam Wilson, CEO bei Trifacta. Ein Ziel von Trifacta sei es gewesen, eine Self-Service-Lösung für alle, die mit Daten arbeiten, bereitzustellen. Durch die Kooperation mit Google können Anwender diese Datenaufbereitung mit wenigen Klicks aus der Google Cloud Platform beziehen.

Webinar

Digitalisierung fängt mit Software Defined Networking an

In diesem Webinar am 18. Oktober werden Ihnen die unterschiedlichen Wege, ein Software Defined Network aufzubauen, aus strategischer Sicht erklärt sowie die Vorteile der einzelnen Wege aufgezeigt. Außerdem erfahren Sie, welche Aspekte es bei der Auswahl von Technologien und Partnern zu beachten gilt und wie sich auf Grundlage eines SDN eine Vielzahl von Initiativen zur Digitalisierung schnell umsetzen lässt.

Unter dem Begriff Data Wrangling versteht der Hersteller den Prozess, Daten, die in ihren Ursprünglichen Formaten vorliegen für Analysen vorzubereiten. Dabei gibt es in dem Kernprodukt von Trifacta sechs Schritte der Datenvorbereitung: Entdecken, Strukturieren, Säubern, Anreichern, Validieren und Publizieren. Dann stehen noch weitere Verfahren wie etwa das Data-Blending, also das Mischen von verschiedenen Datensätzen, zur Verfügung, über die Anwender weitere Einsichten gewinnen können. So lassen sich beispielsweise Anomalien oder widersprüchliche Daten erkennen. Über eine KI-Lösung schlägt die Lösung Korrekturmaßnahmen vor.

Trifacta liefert unter anderem auch eine Daten-Integration für Hadoop. (Trifacta)

Die Trifacta-Lösung arbeitet mit Deep-Learning und Künstlicher Intelligenz, um dem Nutzer in jedem Schritt Vorschläge machen zu können. Die Trifacta-Lösungen Wrangler und Wrangler Enterprise richten sich vor allem an Datenanalysten ohne technischen Hintergrund und über eine Vorschau können Anwender stets die Ergebnisse ihre Aktionen vorhersehen.

Derzeit nutzen mehr als 4400 Unternehmen wie die Royal Bank of Scotland, Samsung, die Versicherung Zurich oder der Helpdesk-Spezialist Atlassin die Lösungen des jungen Unternehmens.

Redaktion

Recent Posts

Bau-Spezialist Schöck: Migration von SAP ECC ERP auf S/4HANA

Bau- und Fertigungsspezialist investiert in die S/4HANA-Migration und geht mit RISE WITH SAP in die…

1 Tag ago

Pure Storage: Cloud, KI und Energieeffizienz

Trends 2025: Rasante Entwicklungen bei Automatisierung, KI und in vielen anderen Bereichen lassen Unternehmen nicht…

2 Tagen ago

GenKI verbessert Datenmanagement und Angebotsgenauigkeit

DHL Supply Chain nutzt generative KI-Anwendungen für Datenbereinigung und präzisere Beantwortung von Angebotsanforderungen (RFQ).

3 Tagen ago

Rolls-Royce Power Systems nutzt industrielle KI aus der IFS Cloud​

Marke mtu will globale Serviceabläufe optimieren und strategische Ziele hinsichtlich Effizienz, Nachhaltigkeit und Wachstum unterstützen.

3 Tagen ago

Thomas-Krenn.AG: viele Pflichten, knappe Ressourcen, mehr freie IT-Welt

IT-Infrastruktur-Trends 2025: Open-Source-Projekte sowie aufwändige regulatorische und Pflichtaufgaben werden das Jahr prägen.

3 Tagen ago

Stadt Kempen nutzt Onsite Colocation-Lösung

IT-Systeme werden vor Ort in einem hochsicheren IT-Safe betrieben, ohne auf bauliche Maßnahmen wie die…

4 Tagen ago