Categories: Data

Rohdaten-Aufbereitung in der Cloud

Google stellt den Service Google Cloud Dataprep vor. Die Lösung soll Anwendern ein Tool für die Aufbereitung von Rohdaten über die Cloud bereitstellen. Als Nutzeroberfläche kommt bei Google Cloud Dataprep die Oberfläche von von Trifacta und dem Photon Compute Framework zum Einsatz. Cloud Dataprep ist zudem in Google Cloud Dataflow nativ integriert. Das ermöglicht eine serverlose, autoskalierende Ausführung verschiedener Datenaufbereitungsverfahren.

Der neue Google-Service ermöglicht es Daten-Analysten, in der Google Cloud Platform-Umgebung verschiedenartige Datasets für ein breites Spektrum an Downstream-Einsätzen, wie etwa Analytics und maschinelles Lernen, intuitiv zu erkunden und aufzubereiten. So können Anwender auch betriebliche Abläufe optimieren oder neue Möglichkeiten für Geschäftsmodelle erkunden.

Einige Anwender geben an, dass bei Daten-Analysen bis zu 80 Prozent des zeitlichen Aufwands auf die Vorbereitung der Daten verwendet werden, wie Fausto Ibarra, Director Product Management für Google Cloud Platform in einem Blog erklärt.

Das Feautre ‘Interactive Exploration’ mit Google Cloud Dataprep zeigt mögliche Ergebnisse an und führt den Nutzer über Vorschläge schneller zu Ergebnissen. (Bild: Trifacta)

“Immer mehr Unternehmen verlagern Analytics-Workloads in die Cloud”, kommentiert Adam Wilson, CEO bei Trifacta. Ein Ziel von Trifacta sei es gewesen, eine Self-Service-Lösung für alle, die mit Daten arbeiten, bereitzustellen. Durch die Kooperation mit Google können Anwender diese Datenaufbereitung mit wenigen Klicks aus der Google Cloud Platform beziehen.

Webinar

Digitalisierung fängt mit Software Defined Networking an

In diesem Webinar am 18. Oktober werden Ihnen die unterschiedlichen Wege, ein Software Defined Network aufzubauen, aus strategischer Sicht erklärt sowie die Vorteile der einzelnen Wege aufgezeigt. Außerdem erfahren Sie, welche Aspekte es bei der Auswahl von Technologien und Partnern zu beachten gilt und wie sich auf Grundlage eines SDN eine Vielzahl von Initiativen zur Digitalisierung schnell umsetzen lässt.

Unter dem Begriff Data Wrangling versteht der Hersteller den Prozess, Daten, die in ihren Ursprünglichen Formaten vorliegen für Analysen vorzubereiten. Dabei gibt es in dem Kernprodukt von Trifacta sechs Schritte der Datenvorbereitung: Entdecken, Strukturieren, Säubern, Anreichern, Validieren und Publizieren. Dann stehen noch weitere Verfahren wie etwa das Data-Blending, also das Mischen von verschiedenen Datensätzen, zur Verfügung, über die Anwender weitere Einsichten gewinnen können. So lassen sich beispielsweise Anomalien oder widersprüchliche Daten erkennen. Über eine KI-Lösung schlägt die Lösung Korrekturmaßnahmen vor.

Trifacta liefert unter anderem auch eine Daten-Integration für Hadoop. (Trifacta)

Die Trifacta-Lösung arbeitet mit Deep-Learning und Künstlicher Intelligenz, um dem Nutzer in jedem Schritt Vorschläge machen zu können. Die Trifacta-Lösungen Wrangler und Wrangler Enterprise richten sich vor allem an Datenanalysten ohne technischen Hintergrund und über eine Vorschau können Anwender stets die Ergebnisse ihre Aktionen vorhersehen.

Derzeit nutzen mehr als 4400 Unternehmen wie die Royal Bank of Scotland, Samsung, die Versicherung Zurich oder der Helpdesk-Spezialist Atlassin die Lösungen des jungen Unternehmens.

Redaktion

Recent Posts

OT-Security braucht zunächst Asset-Transparenz

Unternehmen wissen oft nicht, welche Geräte in der Produktion eine IP-Adresse haben, warnt Peter Machat…

1 Tag ago

Künstliche Intelligenz erreicht die Cloud

KPMG-Studie: 97 Prozent der Cloud-nutzenden Unternehmen verwenden KI-Dienste von Cloud-Anbietern.

2 Tagen ago

AI Act: Durchblick im Regulierungsdickicht

Bitkom veröffentlicht Online-Tool und Leitfaden zum KI-Einsatz in Unternehmen. Beide Angebote sind kostenlos.

2 Tagen ago

Coveo beschleunigt europäisches Wachstum durch Expansion in der DACH-Region

Neue Kunden sind unter anderem SAP, Conforama Schweiz, 11teamsports, Phillip Morris International, Baywa und Thalia.

3 Tagen ago

Britische Behörden setzen auf Oracle Cloud

Oracle schafft einheitliche Plattform für vier Ministerien und über 250.000 Beamte mit der Oracle Applications…

3 Tagen ago

Windows 10: Wer haftet für Datenschutz nach Support-Ende?

Der Grund: Geräte, die mit veralteter Software arbeiten, sind anfällig für Cyberangriffe und Datenlecks.

3 Tagen ago