Silicon.de-Blogger Daniel Fallmann beleuchtet in seinem aktuellen Blog den Mehrwert von Big Data in Unternehmen. Denn Daten stehen immer stärker im Fokus der Aufmerksamkeit, da von ihnen zunehmend der Erfolg eines Unternehmens abhängt.
Es ist eine unumstößliche Wahrheit unserer Zeit, dass in der Geschäftswelt ohne IT nichts mehr läuft. Das Gleiche gilt übrigens für das Gesundheitswesen, die Stromversorgung und den gesamten Flugverkehr. Unbestritten ist auch, dass die Daten, die in einem Unternehmen auf Basis der eingesetzten IT produziert werden, immer stärker ins Zentrum der Aufmerksamkeit rücken. Der Erfolg eines Unternehmens wird zunehmend dadurch bestimmt, auf welche Weise die Verantwortlichen mit Hilfe der IT die Daten sammeln, sie verarbeiten und zu ihrem Vorteil nutzen – und das am besten voll automatisiert und in hoher Geschwindigkeit.
Wer das Spiel mit den Daten beherrscht, bekommt nicht nur ein klares Bild davon, was in der Vergangenheit etwa vertrieblich schief gelaufen ist, und kann entsprechende Maßnahmen setzen. Es ist ihm zudem möglich – und das ist in der heutigen Zeit noch viel wichtiger –, auf Basis vorliegender Daten bis zu einem gewissen Grad in die Zukunft zu blicken, um Produktionsmengen zu bestimmen oder Marketingaktionen zu koordinieren. Es ist immer wieder verblüffend zu sehen, welchen Unterschied es etwa für das eine oder andere Handelsunternehmen macht, ob es, ganz banal, morgen regnen wird oder nicht.
Für die beschriebenen Aufgaben sind seit vielen Jahrzehnten Technologien im Einsatz, die sich unter dem Begriff Business Intelligence zusammenfassen lassen. Mit diesen können die für das Wohl eines Unternehmens unabdingbaren Aufgaben wie Reporting und Forecasting hervorragend abgedeckt werden.
Business Intelligence hat allerdings einen “Schönheitsfehler”: Die Technologie stammt aus einer Zeit, als die Welt aus IT-Sicht noch geordnet schien (was sie in Wahrheit wohl niemals war). Mit anderen Worten: Die Geschäftswelt hatte aus Sicht der Unternehmer und IT-Verantwortlichen Struktur, zusammengesetzt aus strukturierten Daten, aus denen sich mit den richtigen Tools relativ einfach Entwicklungen der Vergangenheit und Möglichkeiten der Zukunft ableiten ließen.
Die Welt des Jahres 2014 präsentiert sich dagegen wesentlich chaotischer. Die Quellen, aus denen sich die Sicht auf das eigene Unternehmen, den Kunden und den Markt speisen, sind nicht mehr fast ausschließlich die klassischen, vorbildlich strukturierten Business-Systeme wie ERP oder CRM, sondern eine Vielzahl an Kanälen wie Social Media oder M2M, die alle eines gemeinsam haben: Der Output ist in der Regel unstrukturiert.
Der Marktforscher IDC spricht davon, dass 80 Prozent der im Geschäftsalltag anfallenden Daten unstrukturiert sind. 80 Prozent, mit denen klassische Datenanalyse-Technologien wenig zufriedenstellend umgehen können. Man denke an einen Produzenten, der mehr über die Akzeptanz eines Produkts herausfinden will. Die Absatzzahlen zeigen nur einen, nämlich den technischen Aspekt. Viel interessanter sind aber Posts in einschlägigen Konsumenten-Foren, Blogbeiträge, Tests, Facebook-Kommentare – wer soll all diese manuell durchforsten, da es scheinbar keine automatisierten Tools dafür gibt?
Genau hier setzt Big Data an. Aus meiner Sicht ist die zentrale Stärke von Big Data weniger das Vermögen, sehr große Datenmengen in sehr kurzer Zeit verarbeiten und analysieren zu können. Das ist der technische Aspekt. Viel interessanter ist die Fähigkeit, unstrukturierte Daten in strukturierte zu verwandeln. Genau hier liegt der Mehrwert, den Big Data Unternehmen liefern kann.
Wie Big Data diese Verwandlung zustande bringt, lässt sich am besten an Hand eines Beispiels aus der Praxis beschreiben. Ein großes Versicherungsunternehmen bekommt täglich Tausende Mails oder Briefe mit Schadensmeldungen in unterschiedlicher Qualität – bis hin zum nicht entzifferbaren Gestammel. Per definitionem sind das alles unstrukturierte Daten. Der klassische Weg ist, dass Sachbearbeiter sich der Sache annehmen und die für den jeweiligen Fall relevanten Informationen extrahieren: Personen- und Ortsnamen, Kfz-Kennzeichen, Kontaktdaten, Schadenstypen, etc. Ich bezeichne diese wenig kreative Arbeit “Monkey Business”, geistige Fließbandarbeit, die zu automatisieren keinem Sachbearbeiter ungelegen kommen würde.
Mit einer cleveren Big Data-Lösung kann man das „Monkey Business“ auf ein Mindestmaß reduzieren und die Sachbearbeiter für sinnvollere Aufgaben freispielen. InSpire von Mindbreeze entlastet beispielsweise den Mitarbeiter, indem es die Mail eines Versicherungsnehmers in einem ersten Durchgang nach logischen Textbausteinen durchforstet – ein Prozess, den wir “Entity Extraction” nennen und der sich auf syntaktisch-semantischer Ebene abspielt. Das System erkennt automatisch sämtliche Informationen des Versicherungsnehmers, die sich dem System zu erkennen geben.
Das Ergebnis dieser Textanalyse lässt sich verbessern, indem Thesauri und Taxonomien unterlegt werden, die gleichsam die Essenz des Geschäftsalltags widerspiegeln – der zweite Schritt der Textanalyse. Der Begriff “Personenschaden” kann auf diese Weise mit einer bestimmten Klassifikation des Schadenfalls verknüpft werden und dient so der Strukturierung und damit der Vereinfachung und Beschleunigung der Bearbeitung.
Der dritte Aspekt, der eine intelligente Big Data-Analyse ausmacht, ist das Selbstlernen: Je länger das System im Einsatz ist, desto genauer und besser geht die Wandlung von unstrukturierten in strukturierte Daten über die Bühne.
Nach den drei semantischen Analyseschritten, die frei kombiniert werden können, ist die E-Mail des Versicherungsnehmers kein Gestammel mehr, das der menschlichen Interpretation bedarf, sondern ein Baustein in einem automatisierten Prozess, an dessen Ende die Erfüllung der Eingangsmail steht: die möglichst rasche und unkomplizierte Wiedergutmachung des Schadens. Am Ende des Tages gilt: Ist der Versicherungsnehmer zufrieden, ist der Versicherer zufrieden.
Ein weiteres Beispiel ist die HR-Abteilung eines renommierten Unternehmens, das mit Big Data ein großes Stück ihres “Monkey Business” an die IT abtreten kann. Wird hier nämlich ein Posten ausgeschrieben, sind es nicht selten Tausende Bewerbungen, die in PDF-Form ankommen. Anstatt jede Zusendung einzeln durchzugehen, lässt man das System eine Vorauswahl treffen, indem es den Stoß der Bewerbungen exakt auf Basis des Anforderungsprofils durchforstet.
So gesehen ist Big Data nichts anderes als Business Intelligence der heutigen Zeit – diesmal aber wirklich intelligent.