Categories: Cloud

Microsoft startet Azure Data Lake Store auf Linux

Microsoft stellt mit dem Azure Data Lake Store einen Service vor, über den sich über die Cloud große Datensätze speichern und analysieren lassen. Der Dienst ist derzeit als Beta-Version unter dem Namen Azure Data Lake verfügbar. Der Service werde im Verlauf des Jahres frei gegeben. Der neue Microsoft Service ist mit dem Hadoop Distributed File System (HDFS) kompatibel.

Damit bekommen Anwender die analytischen Tools, die Hadoop-Nutzer gewohnt sind. Microsoft ergänzt diese mit eigenen Entwicklungen. So können Nutzer des Data Lake Store die Daten im HDFS-Format abspeichern und diese mit Daten aus anderen Datenquellen auf Azure kombinieren.

Microsoft stellt den neuen Azure Data Lake Store vor und geht damit ein weiteres Mal auf Open Source zu. (Bild: Microsof)

Dadurch, dass der Dienst mit HDFS kompatibel ist, können Anwender auch mit Lösungen, die HDFS unterstützen, auf die in dem Store in Azure Data Lake gespeicherten Daten zugreifen. Als Beispiele nennt Microsoft Cloudera, Hortonworks oder MapR.

Ebenfalls im Laufe des Jahres wolle Microsoft den neuen Service Data Lake Analytics vorstellen. Auch für diesen Service verwendet Microsoft zahlreiche Open-Source-Technologien wie Apache YARN, das die Verarbeitung der Daten sicherstellt.

Für Data Lake Analytics stellt Micorosft auch die SQL-Abfrage U-SQL bereit, über die Nutzer in SQL in den Datensätzen in Haddop arbeiten können. Somit können Nutzer Neben YARN-Analysen auch U-SQL verwenden. Der Vorteil dabei ist, dass so neben der .Net-Runtime auch herkömmliche SQL-Ausdrücke verwendet werden können. Ein weiterer Vorteil dabei ist, dass so auch Daten analysiert werden können, die in SQL Server in Azure, Azure SQL Database oder im Azure SQL Data Warehouse gespeichert sind.

Daneben können Anwender auch über die Azure Data Lake Tools for Visual Studio in der Entwicklerumgebung Anwendungen für den Azure Data Lake verfassen. Auch das Debugging von entsprechenden Anwendungen soll so vereinfacht werden, heißt es von Microsoft.

Anwender können neben Hadoop auf Azure auch die verwaltete Hadoop-Distribution von Microsoft, HDInsight, verwenden. Seit heute ist auch eine Linux-HDInsight-Version auf Azure auf Basis von Ubuntu verfügbar. Eine Version für Windows bietet Microsoft seit 2013 an. Damit können Anwender jetzt auf verschiedene quelloffene Analytic-Tools wie Hive, Spark, Storm oder HBase zurückgreifen und Managed Clusters auf Linux verwenden.

Zusammen mit Hortonworks und Canonical habe Microsoft die HDP-Distribution von Ubuntu entwickelt, die die Grundlage für die Linux-Version von HDInsight liefert. Dadurch, wie es in einem Canonical-Blog heißt, werde es auch für Anwender einfacher, On-Premises-Hadoop-Deployments in die Cloud zu migireren. Gleichzeitig würden auch hybride Szenarien einfacher realisierbar werden.

Microsofts Zielsetzung mit den neuen Angeboten ist klar. Einerseits sollen diejenigen Anwender, die bereits mit quelloffenen Technologien arbeiten ebenfalls Azure verwenden können. Auf der anderen Seite sollen die neuen Services das Arbeiten mit den verschiedenen Open-Source-Technologien rund um Hadoop möglichst einfach gestalten. Oder wie T.K. “Ranga” Rengajarian, Vice President Data Platform Corpoarte bei Microsoft erklärt: Anwender sollen “maximale Informationen aus allen Daten, überall herauszuziehen können.”

Zudem betont Rengajarian, dass immer mehr ISVs Tools liefern, um damit über HDInsight Big-Data-Lösungen auf Azure zu bringen.

Zahlreiche ISVs entwerfen bereits Lösungen für HDInsight auf Azure. (Bild: Microsoft)
Redaktion

Recent Posts

IT 2025: IT-Führungskräfte erwarten massiven KI-Ruck

Einsatz von KI-Lösungen wirbelt auch in deutschen Unternehmen die Liste der Top-Technologieanbieter durcheinander.

12 Stunden ago

Sofortzahlungen im Wandel: Sicherheit und KI als treibende Kräfte

Echtzeitüberweisungen erfüllen die Erwartungen der Nutzer an Geschwindigkeit, sind jedoch anfällig für spezifische Sicherheits- und…

15 Stunden ago

Blockaden und Risiken bei APM-Projekten vermeiden

Application Portfolio Management (APM) verspricht Transparenz, mehr IT-Leistung und Effizienz – theoretisch.

2 Tagen ago

BSI-Bericht: Sicherheitslage im Cyberraum bleibt angespannt

Im Berichtszeitraum Mitte 2023 bis Mitte 2024 wurden täglich durchschnittlich 309.000 neue Schadprogramm-Varianten bekannt.

3 Tagen ago

KI-Hype in der Cybersicherheit – oder besser doch nicht?

KI kommt in der Cybersicherheit zum Einsatz, etwa um Abweichungen im Netzwerkverkehr zu identifizieren. Ist…

4 Tagen ago

Netzwerksegementierung schützt vor Angriffen über die OT

Ungepatchte und veraltetete Maschinen-Software ist ein beliebtes Einfallstor für Hacker, warnt Nils Ullmann von Zscaler…

4 Tagen ago