Quelloffene Datenintegration für Big Data
Die “Demokratisierung” von Big Data: Mit der Veröffentlichung von Talend Open Studio for Big Data betritt nun auch der französische Spezialist für Open Source Integration, Talend, die Hadoop-Arena.
Dafür bekommt das Flaggschiffprodukt Talend Open Studio eine native Unterstützung für Apache Hadoop. Zusätzlich wird Talend Open Studio for Big Data mit der Hadoop-Distribution von Hortonworks gebündelt. Die Hortonworks Data Platform ermöglicht als reinrassige Open-Source-Lösung das Speichern, Verarbeiten und Analysieren großer Datenvolumina.
Die neue Talend-Lösung ermöglicht es laut Hersteller über vereinfachte Handhabung und eine grafische Entwicklungsumgebung die Effizienz von Datenprojekten zu steigern. Dabei unterstützt Talend Open Studio für Big Data native das Hadoop Distributed File System (HDFS), Pig, Hbase, Sqoop und Hive.
Durch den Einsatz der MapReduce-Architektur von Apache Hadoop für die Bearbeitung hochgradig verteilter Daten, erzeugt Talend nativen Hadoop-Code und lässt Datentransformationen für direkt innerhalb von Hadoop ablaufen, was die Skalierbarkeit erhöht. So lassen sich laut Hersteller auch traditionellen Datenintegrationsprozesse, etwa auf ETL- oder ELT-Basis, mit Hadoop-Prouekten kombinieren.
“Indem wir Talend Open Studio for Big Data zur Schlüsselkomponente für Integration in unserer Hortonworks Data Platform gemacht haben, bieten wir Hadoop-Anwendern die Möglichkeit, Daten in und aus Hadoop zu bewegen, ohne das dazu komplexer Code geschrieben werden muss”, so Eric Baldeschwieler, CTO und Mitgründer von Hortonworks.
“Durch die Veröffentlichung von Talend Open Studio for Big Data unter Apache-Softwarelizenz und unsere Partnerschaft mit Hortonworks, können wir jetzt zur Demokratisierung von Big Data beitragen, indem wir die Integration von Hadoop in bestehende Datenarchitekturen vereinfachen, ohne dass massiv in nicht skalierbare, proprietäre Lösungen investiert werden müsste”, so Fabrice Bonan, Mitgründer und COO von Talend. Talend Open Studio for Big Data ist ab Mai 2012 erhältlich.