Big Data, die Riesen-Chance für Open Source Analytics

Apache, Linux oder Android haben gezeigt, dass Open Source durchaus gegenüber proprietären Produkte konkurrenzfähig ist. Jetzt tut sich ein neues Hype-Thema auf und die Chancen stehen nicht allzu schlecht, dass Open Source auch beim Thema Big Data dauerhaft eine Vorreiterrolle einnehmen könnte.

Um es mit den Worten des Forrester-Analysten James Kobielus zu sagen: “Big Data sind ein Ökosystem, in dem Open Source Ansätze die größte Triebkraft sind, mit der höchsten Verbreitung und den fieberhaftesteten Innovationen.” Und auch in Bereichen wie Advanced Analytics wird das Gewicht von Open-Source-Technologien immer größer.

Die Gewinner auf der Open-Source-Seite heißen Talend, Pentaho oder Jaspersoft. Sie profitieren vor allem von dem Trend, dass auch große Anbieter ihre Lösungen stark mit Hadoop und der quelloffenen Sprache R integrieren.

Kobielus erklärt den Erfolg von Open Source mit der Tatsache, dass die Community im Bereich Big Data viele neue Ansätze hervorbrachte. Damit hat die Community auch proprietäre Produkte beeinflusst.

Und gerade im Bereich Open Source Analytics reifen die Angebote und Anbieter in Windeseile heran. Und inzwischen sind diese Angebote bereits so ausgefeilt und verlässlich, dass Forrester empfiehlt Hadoop zum Grundstein für das Enterprise Data Warehouse (EDW) in der Cloud zu machen. R sollte als Codebasis für die nächste Generation von Entwicklerumgebungen für Big Data dienen. Zudem geht man bei Forrester davon aus, dass zahlreiche NoSQL-Datenbanken sich zu lohnenden Alternativen zu proprietären Angeboten entwickeln.

Etablierter Anbieter könnten durch diese Entwicklung gezwungen werden, ihre Services an das Open-Source-Modell anzupassen und vor allem auch ihre Geschäftsmodelle auf die Open-Source-Landschaft auszurichten. Die EMC-Tochter Greenplum hat hier ja mit der Öffnung von Chorus, einem Social-Media Framework für Big Data-Entwicklung, schon ein erstes Beispiel geliefert. Auf der anderen Seite sagt Kobielus eine Konzentrationswelle im Open-Source-Lager voraus. Zusammenschlüsse und Übernahmen werden neue Player und neue Schwerpunkte im Open-Source-Segment hervorbringen.

Das Beispiel Greenplum Chorus fiel ja bereits. Die Zielgruppe von Chorus ist der ‘Data Scientist’. Diese neue Fachkraft vereint einen Daten-Analytiker und einem wisschenschaftlichem Forscher, der die Anwedungen für Big Data dann auch optimieren kann. Und über Chorus sollen sich diese Data Scientists dann über ihre neuen Projekte austauschen.

Laut dem Gartner-Analysten Doug Laney arbeiten diese Data Scientist “in Teams, sind vertraut und bewandert mit “Big Data”-Sets und erfahren in Kommunikation.” Ergänzt wird dieses Profil durch Kenntnisse bei lernenden Maschinen, im Computing und Algorithmen. Hadoop, Pig, Python und Java sollten ebenfalls keine unbekannten Felder für den Data Scientist sein.

Silicon-Redaktion

Recent Posts

OT-Security braucht zunächst Asset-Transparenz

Unternehmen wissen oft nicht, welche Geräte in der Produktion eine IP-Adresse haben, warnt Peter Machat…

1 Tag ago

Künstliche Intelligenz erreicht die Cloud

KPMG-Studie: 97 Prozent der Cloud-nutzenden Unternehmen verwenden KI-Dienste von Cloud-Anbietern.

2 Tagen ago

AI Act: Durchblick im Regulierungsdickicht

Bitkom veröffentlicht Online-Tool und Leitfaden zum KI-Einsatz in Unternehmen. Beide Angebote sind kostenlos.

2 Tagen ago

Coveo beschleunigt europäisches Wachstum durch Expansion in der DACH-Region

Neue Kunden sind unter anderem SAP, Conforama Schweiz, 11teamsports, Phillip Morris International, Baywa und Thalia.

3 Tagen ago

Britische Behörden setzen auf Oracle Cloud

Oracle schafft einheitliche Plattform für vier Ministerien und über 250.000 Beamte mit der Oracle Applications…

3 Tagen ago

Windows 10: Wer haftet für Datenschutz nach Support-Ende?

Der Grund: Geräte, die mit veralteter Software arbeiten, sind anfällig für Cyberangriffe und Datenlecks.

3 Tagen ago