“Daten sind das neue Öl”

Der virtuose Umgang mit großen Datenmengen ist längst nicht mehr das Spezialfeld eines exklusiven Data-Warehouse-Zirkels. Das macht auch der Auftritt von David McCandless deutlich, der als “Data Journalist” bekannt geworden ist. Mit einer ebenso bunten wie überraschenden Präsentation sorgt er dafür, dass hunderte Zuschauer gebannt einer Aufzählung von Zahlen folgten, die eigentlich wie Schlafmittel wirken: Quartals-, Umsatz-, Haushaltszahlen.

Sein “Billion Dollar-O-Gram” vergleicht unter anderem die Ausgaben für den Irak-Krieg mit dem Budget der UN und visualisiert diese Informationen in einprägsamen Infographiken. Kern seiner Arbeit sei, die wesentlichen Daten herauszufiltern anstatt so viele Informationen wie möglich in eine Grafik zu packen.


Bunte Datenanalyse: Das Billion Dollar-O-Gram.
Foto: informationisbeaufiful.net

Es gebe einen großen Unterschied zwischen vereinfachter und optimierter Information, sagt McCandless. Er selbst versuche Informationen zu optimieren und so viele überflüssige Details wie möglich wegzulassen.

Diese Unterscheidung zwischen notwendigen und überflüssigen Daten ist eine der großen Herausforderungen der Data-Warehousing-Zunft der Zukunft. Die neu vorgestellte Teradata-Appliance Active EDW 6680 sortiert automatisiert nach “heißen” und “kalten” Daten, also solchen auf die ein Unternehmen häufig beziehungsweise selten zugreift.

Das heißt aber auch: Zunächst sind alle Daten “heiß”, erst nach einer gewissen Zeit kann anhand der Zugriffsmuster entschieden werden, welche Daten wo richtig aufgehoben sind. Künftig soll es nach den Worten von Chief Development Officer Scott Gnau möglich sein, dass die Appliance schon im Moment des Speicherns weiß, welche Daten für das Unternehmen heiß und kalt sein werden.

“Die Zugriffs-Pattern entsprechen einer gewissen Logik”, erläutert Hermann Wöstefeld, Director Architecture Consulting, im Gespräch mit silicon.de. “Wenn beispielsweise auf neue Kundentabellen innerhalb der ersten drei Monate besonders häufig und danach immer seltener zugegriffen wird, kann man daraus eine Regel ableiten. Vergleichbar mit einem lernenden System.” Insofern sei es durchaus vorstellbar, dass in künftigen Releases entsprechende Algorithmen eingeführt würden.


Teradata-CEO Mike Koehler und Europachef Hermann Wimmer im Gespräch mit silcon.de
Foto: silicon.de

Die Unternehmen werden solche Unterstützung dringend nötig haben. Als neue Treiber und potentielle Großkunden der Data-Warehouse-Szene gelten inzwischen verstärkt das Gesundheitswesen und Smart Grids. “Wenn jeder Haushalt ein Smart Meter hätte, gäbe es nicht genügend Festplatten auf der Welt, um diese Daten zu speichern”, sagt SAS-CEO Jim Goodnight.

In den USA hat jüngst der Energieversorger Souther California Edison (SCE) sein Engagement in diese Richtung verstärkt. Im Rahmen des Projekts “SmartConnect” werden in mehreren Städten herkömmliche Stromzähler durch digitale Zwei-Wege-Geräte ersetzt. “Das ist einer der entscheidenden Schritte auf einem Weg zu einem Smart Grid”, sagt David W. Erickson, Director Information Technology Edison SmartConnect, gegenüber silicon.de. Doch der Weg dorthin ist, nicht nur in Deutschland, noch lang, unter anderem fehlt es an internationalen Standards.

Was in der Gesundheitsbranche mit verstärkter Datenanalyse machbar ist, beschreibt Hermann Wimmer anhand des US-Krankenversicherers Wellpoint. Dieser nutzt die gesammelten Daten der Versicherten seit kurzem nicht mehr nur für die eigene Forschung, sondern stellt die Erkenntnisse auch Krankenhäusern zu Verfügung, um so die Versorgung der Patienten zu verbessern.

“Firmen, denen es nicht gelingt, ihre Daten intelligent zu integrieren und auszuwerten, werden in Zukunft auf der Verliererseite stehen. Davon bin ich überzeugt”, sagt Wimmer. Data Journalist David McCandless formuliert es knapper: “Daten sind das neue Öl.” Laut IBM haben inzwischen 83 Prozent der CIOs das Thema Business Analytics ganz oben auf ihrer To-Do-Liste. Daten-Junkies gibt es inzwischen überall.

Silicon-Redaktion

Recent Posts

Studie: Rund ein Drittel der APIs sind ungeschützt

Angriffe auf APIs und Webanwendungen sind zwischen Januar 2023 und Juni 2024 von knapp 14…

8 Stunden ago

Universitätsmedizin Essen setzt für E-Mail-Sicherheit auf NoSpamProxy

Mit täglich über 45.000 eingehenden E-Mails ist die IT-Abteilung des Klinikums durch Anhänge und raffinierte…

8 Stunden ago

Bau-Spezialist Schöck: Migration von SAP ECC ERP auf S/4HANA

Bau- und Fertigungsspezialist investiert in die S/4HANA-Migration und geht mit RISE WITH SAP in die…

2 Tagen ago

Pure Storage: Cloud, KI und Energieeffizienz

Trends 2025: Rasante Entwicklungen bei Automatisierung, KI und in vielen anderen Bereichen lassen Unternehmen nicht…

3 Tagen ago

GenKI verbessert Datenmanagement und Angebotsgenauigkeit

DHL Supply Chain nutzt generative KI-Anwendungen für Datenbereinigung und präzisere Beantwortung von Angebotsanforderungen (RFQ).

4 Tagen ago

Rolls-Royce Power Systems nutzt industrielle KI aus der IFS Cloud​

Marke mtu will globale Serviceabläufe optimieren und strategische Ziele hinsichtlich Effizienz, Nachhaltigkeit und Wachstum unterstützen.

4 Tagen ago