SAP veröffentlicht In-Memory-Abfrage HANA Vora
Mit der neuen Erweiterung für Apache Spark ‘Vora’ ermöglicht SAP Kontextanalysen für Daten aus Unternehmenssystemen, verteilten Datenquellen und Sensordaten auf Basis von In-Memory.
Mit HANA Vora macht SAP jetzt eine In-Memory-basierte Abfrage-Engine verfügbar. Das Tool erlaubt es, Kontextanalysen in Hadoop, transaktionalen Systemen oder anderen verteilten Datenquellen durchzuführen. Um die Interoperabilität mit anderen Open-Source-Systemen wie Hadoop oder Spark zu erleichtern, hat SAP auch Teile des Codes von HANA Vora freigegeben.
SAP setzt Vora auf Apache Spark auf und tauscht im wesentlichen die Query-Engine aus Spark gegen ein OLAP-Framework (Online Analytical Processing). Vora ergänzt die Plattform SAP HANA, sodass durch die Analyse großer Mengen in operativen und kontextbezogenen Daten aus Unternehmensanwendungen, Data Warehouses, Data Lakes oder auch IoT-Sensoren in der Netzwerkperipherie neue Erkenntnisse möglich sein sollen.
Mit diesem erweiterten Datenverarbeitungs-Framework von Apache Spark ermöglicht Vora auch interaktive Analysen in Hadoop und auch die Verknüpfung operativer Geschäftsdaten mit externen unstrukturierten Daten. Durch die Datenverarbeitung in einem Hadoop-Cluster werde auch die Haltung und Verarbeitung großer Datenmengen vereinfacht, verspricht SAP.
Darüber hinaus ermöglicht Vora eine OLAP-Modellierung von Hadoop-Daten, so dass auch verteilte Hadoop-Daten sich mit Drilldown-Analysen in Echtzeit auswerten lassen. Diese Lösung könne etwa in Branchen wie dem Finanzdienstleistungssektor, der Telekommunikation, der Versorgungsindustrie, dem Gesundheitswesen, der Fertigungsindustrie oder anderen Branchen, die mit großen Datenmengen umgehen müssen, eingesetzt werden.
SAP könne darüber hinaus schon auf verschiedene Partner verweisen, die Support für SAP HANA Vora zugesagt haben, wie etwa Cloudera, Databricks, Hortonworks und MapR Technologies. Darüber hinaus hat SAP verschiedene Funktionen rund um Apache Spark für die Community zugänglich gemacht. Dazu zählen eine Datenhierarchie-Funktion, mit der Drilldown-Analysen von Hadoop-Daten möglich sind, und eine Erweiterung für die Datenquellen-API von Apache Spark, die effizientere Abfragen für verteilte Daten mit Spark in SAP HANA ermöglicht.
Die genannten Technologien sind über GitHub unter der Apache-Lizenz 2.0 verfügbar. SAP kündigt zudem an, die Kooperation mit der Community weiter auszubauen und auch weitere Funktionen und Technologien als Open Source frei zu geben. Weitere Details gibt es über die Entwickler-Version von Vora.
Als einen der ersten Anwender von SAP HANA und HANA Vora nennt SAP den US-amerikanische Energieversorger CenterPoint Energy Houston Electric (CenterPoint Energy). Damit will der Energieversorger sicherstellen, dass die Daten, die bislang in verschiedenen verteilten Systemen verstreut sind, über eine zentrale Plattform zugänglich sind.
Auf diese Weise bekommt das Unternehmen eine Möglichkeit, verteilte Daten, die unter anderem aus Smarten Stromzählern aus mehr als 2,3 Millionen Haushalten stammen, besser für die Analyse verwenden zu können. Alle 15 Minuten senden diese Smartmeter Daten. Diese werden jetzt in einer Hadoop-Umgebung gespeichert, in der mehr als 5 Milliarden Datensätze vorgehalten und mit Hilfe von Hadoop, SAP HANA und SAP HANA Vora verarbeitet werden.
“Unsere ersten Auswertungen haben ergeben, dass wir mit SAP HANA in Kombination mit SAP HANA Vora unsere zukünftigen Abläufe optimal unterstützen und zugleich Innovationen rund um das Internet der Dinge sowie Vorhersageanalysen ermöglichen können”, erklärt Gary Hayes, CIO und SVP von CenterPoint Energy. “Mithilfe der Technologie von SAP können wir uns zum digitalen Echtzeitunternehmen weiterentwickeln und unseren Kunden besseren Service bieten.”