Hadoop mit nativem R-Support

Entscheidungsbaum unter R mit Revolution R Enterprise (RRE7). Quelle: Revolution Analystics

Mit dem neuen Plugin “Revolution R Enterprise” (RRE 7) für Hadoop ermöglicht der Anbieter Revolution Analytics nun auch die Datenanalyse über die quelloffene Sprache R in großen Hadoop-Daten. Neben Support für Hadoop bringt das neue Plugin auch Unterstützung für Teradata-Lösungen mit, wie der Hersteller mitteilt. Damit können statistische Tests mit R nun auch auf den Lösungen von Teradata umgesetzt werden.

R richtet sich auf die statistische Auswertung von Daten, die Ergebnisse lassen sich dann auch grafisch darstellen. R liefert häufig Funktionen, die in standar-Business-Intelligence-Lösungen nicht verfügbar sind und ist damit eine für Analysen immer häufiger genutzte Ergänzung. Inzwischen sollen laut Schätzungen von Revolution Anaytics die Sprache bei über 2 Millionen Anwendern weltweit im Einsatz sein.

RRE 7 unterstützt Hortonworks Data Platform und Cloudera. Das Plugin nutzt wie auch Hadoop die parallele Abfrage auf mehreren Nodes. Die Auswertung erfolgt dabei in den Nodes selbst und die Daten müssen dafür nicht verschoben werden, das sorgt für schnelle Abfragen, heißt es vom Hersteller. Damit sei es auch möglich nicht nur Subsets oder Zusammenfassungen, sondern gesamte Datensätze zu analysieren.

Das Unternehmen hofft durch die Integration mit Hadoop die Verbreitung der Sprache R zu erhöhen. Auch das Anwenderprofil könnte sich dadurch vom Spezialisten hin zum Business-Manager verschieben. Dabei soll auch ein neuer Workflow behilflich sein, der es auch Nicht-Statistikern ermöglicht, bestimmte R-Algorithmen zu implementieren. Das Plugin soll es auch ermöglichen, R direkt mit Hadoop zu verbinden. Bislang mussten Entwickler dafür mit Java arbeiten.

In addition to supporting these new platforms, RRE7 also features a number of new algorithms and processes. One is a collection of models for setting up Decision Forests, a machine learning technique for predicting future outcomes. A new batch of Stepwise Regression functionalities can help automate the process of selecting the most important variables to be used in a predictive model. A new Decision Tree visualization can provide a graphical way for depicting complex relationships and correlations within a set of data.

Redaktion

Recent Posts

IT 2025: IT-Führungskräfte erwarten massiven KI-Ruck

Einsatz von KI-Lösungen wirbelt auch in deutschen Unternehmen die Liste der Top-Technologieanbieter durcheinander.

1 Tag ago

Sofortzahlungen im Wandel: Sicherheit und KI als treibende Kräfte

Echtzeitüberweisungen erfüllen die Erwartungen der Nutzer an Geschwindigkeit, sind jedoch anfällig für spezifische Sicherheits- und…

1 Tag ago

Blockaden und Risiken bei APM-Projekten vermeiden

Application Portfolio Management (APM) verspricht Transparenz, mehr IT-Leistung und Effizienz – theoretisch.

3 Tagen ago

BSI-Bericht: Sicherheitslage im Cyberraum bleibt angespannt

Im Berichtszeitraum Mitte 2023 bis Mitte 2024 wurden täglich durchschnittlich 309.000 neue Schadprogramm-Varianten bekannt.

4 Tagen ago

KI-Hype in der Cybersicherheit – oder besser doch nicht?

KI kommt in der Cybersicherheit zum Einsatz, etwa um Abweichungen im Netzwerkverkehr zu identifizieren. Ist…

4 Tagen ago

Netzwerksegementierung schützt vor Angriffen über die OT

Ungepatchte und veraltetete Maschinen-Software ist ein beliebtes Einfallstor für Hacker, warnt Nils Ullmann von Zscaler…

5 Tagen ago