Big SQL von IBM verbindet Hadoop mit SQL

Auf der IBM-Konferenz Information on Demand hat IBM zahlreiche Neuerungen vorgestellt. Dabei fand die Technologie Big SQL 2.0 bislang nur wenig Beachtung. Big SQL 2.0 ist eine Erweiterung für die IBM-Technologie InfoSphere BigInsights. Allerdings liefert dieses Tool für Unternehmen, die derzeit Schwierigkeiten haben, geeignete Hadoop- oder andere Big-Data-Experten zu finden, eine viable Alternative.

Denn Big SQL liefert, wie der Name impliziert, ein Tool, das es ermöglicht, Abfragen in Big-Data-Datenbanken mit der herkömmlichen SQL-Syntax zu erstellen. Big SQL liefert eine Art Schicht, die grob gesagt SQL für die jeweiligen Big-Data-Technologien übersetzt.

IBM schlägt mit Big SQL eine Brücke zwischen SQL und Hadoop. Quelle: IBM

Derzeit unterstützt Big SQL 2.0 unter anderem das Erstellen von neuen Tabellen in Hive, HBase, MapReduce und Hadoop-Technologien.

Stephan Reimann, Big Data Specialist bei IBM, sieht darin die Möglichkeit, dass eben ganz unterschiedliche Anwendungen, die SQL unterstützen hier die technischen Möglichkeiten von Big Data nutzen können, ohne dass Anwender diese Abfragen manuell in den verschiedenen Big-Data-Technologien manuell anpassen müssen.

Das erleichtere nicht nur den Administratoren das Leben, die damit über SQL Big-Data-Funktionalitäten bekommen, sondern erlaubt es auch ‘herkömmlichen’ Anwendungen mit verteilten Big-Data-Anwendungen zu sprechen.

Über die Big-SQL-Treiber JDBC und ODBC (Java- oder offene Datenbank-Verbindungen)  sei das in den meisten Fällen über herkömmliche SQL-Syntax möglich. In manchen Fällen allerdings würden dabei auch SQL-Erweiterungen von IBM zum Einsatz kommen, um damit dedizierte Hadoop-basierte Technologien nutzen zu können.

Daneben könne Big SQL auch LOAD-Kommandos aus verschiedenen relationalen Datenbank-Management-Systemen wie Netezza, DB2 oder auch Teradata umsetzen. Auch Datein, die lokal im BigInsights Distributed File System gespeichert sind, lassen sich auf diese Weise verarbeiten.

Die SQL Query Engine unterstütze laut IBM Joins, Unions, Grouping, Common Table Expressions und neben Windowing-Funktionen auch weitere gängige SQL-Expressions.

Darüber hinaus lassen sich auch Data-Access-Strategien konfigurieren. So könne Big SQL entweder das MapReduce-Framework aus Hadoop verwenden oder aber die die Abfragen lokal im Big SQL-Server verarbeiten.

Zielgruppe sind laut IBM vor allem Unternehmen mit umfangreichen SQL-Kenntnissen oder mit Business-Intelligence-Anwendungen, die auf SQL basieren. Dank Big SQL seien solche Organisationen in der Lage, bestehende Fachkenntnisse, Tools und Anwendungen auch zusammen mit Hadoop zu nutzen.

“Tatsächlich prüfen einige Unternehmen mit großen Data-Warehouses, die auf traditionellen relationalen Datenbankmanagementsystemen aufsetzen, Hadoop-basierte Plattformen als Möglichkeit, zum Beispiel Cloud-Daten oder andere, weniger häufig genutzte Informationen zu speichern. Und zwar in einer Weise, dass diese Daten nach wie vor abgefragt werden können”, heißt es dazu von IBM.

Auch das BigInsights Eclipse-Plugin von IBM liefert Support für Big SQL. Quelle: IBM

Redaktion

Recent Posts

Mehr Datenschutz in der Montage

Assistenzsysteme unterstützen Monteure bei der Arbeit. Zu oft zahlt man jedoch mit den eigenen Daten…

2 Tagen ago

Cyber Resilience Act: Countdown läuft

Hersteller werden stärker in die Pflicht genommen, den gesamten Lebenszyklus ihrer Produkte in den Blick…

2 Tagen ago

KI auf dem Prüfstand

LLMs besitzen einerseits innovative neue Fähigkeiten, stellen Unternehmen allerdings auch vor diverse Herausforderungen: ob EU…

3 Tagen ago

Rechenzentren: Deutschland verliert Anschluss

Server-Ausbau in den USA und China macht große Fortschritte, deutscher Weltmarktanteil sinkt. Lichtblicke in Frankfurt…

3 Tagen ago

KI steigert Nachfrage nach hybriden Workplace-Umgebungen

Der Markt für Workplace Services gerät in Bewegung. Das bestmögliche digitale Nutzererlebnis gilt als Schlüssel…

3 Tagen ago

Hagebau erreicht E-Mail-Sicherheit mit der NoSpamProxy Cloud

Schutz für 10.000 Postfächer über rund 200 Domains: Private-Stack-Variante kombiniert Vorteile einer Cloud-Lösung mit Sicherheit…

4 Tagen ago