Der Data Scientist ist wie ein Goldsucher, so Daniel Fallmann, Gründer und Geschäftsführer der Mindbreeze GmbH, in seinem ersten Blog für silicon.de. Doch dieser Data Scientist hat nicht nur guten Karten bei der Job-Wahl sondern auch einen spannenden und möglicherweise sogar eine “weltbewegende” Aufgabe.
Die Harvard Business Review-Autoren Thomas H. Davenport und D.J. Patil bezeichnen den Data Scientist als “The Sexiest Job of the 21st Century”. Im Grunde geht es bei diesem noch jungen Berufsfeld darum, aus den schnell wachsenden Datenbergen – Stichwort Big Data – all jene Informationen zu generieren, die das Unternehmen braucht, um sich beispielsweise besser den wechselnden Geschäftsbedingungen anpassen oder effizienter arbeiten zu können. Die Idee ist nicht neu – was also ist daran so sexy?
Eine Menge. Der Job des Data Scientists ist in etwa vergleichbar mit dem eines Goldschürfers, der ein umfassendes Wissen besitzt, um die Informations-Nuggets möglichst effizient, schnell und gewinnbringend aus den Tiefen der Rechenzentren zu holen. Er ähnelt einem Pionier, der Neuland betritt, indem er dort Muster erkennt, wo andere nur Datenchaos sehen. Seine Arbeit erinnert in bestimmten Fällen an einen Forensiker, der anhand kleinster Indizien die Ursachen für Unzulänglichkeiten in Geschäftsprozessen herausholen kann. Und er ist fähig, bis zu einem gewissen Grad verlässlich in die Zukunft zu blicken, weil seine Vorhersagen nicht Bauchgefühl sind, sondern auf den neuesten Erkenntnissen und Methoden der Predictive Analysis fußen. Wenn die Summe all dieser Fähigkeiten nicht sexy ist, was dann?
Unter diesen Vorzeichen wundert es nicht, dass Data Scientists derzeit heiß begehrt sind. Weniger in Europa, dafür umso mehr in den USA oder auch China. In diesen Ländern erkennen viele Unternehmen, dass man vor der exponenziell wachsenden Datenflut nicht kapitulieren muss, sondern diese zu seinem Vorteil nutzen kann – vorausgesetzt, man hat den passenden Experten zur Hand. Auch immer mehr Startups stellen Data Science ins Zentrum ihres Business, da die Daten-Wissenschaft prädestiniert ist, innovative Geschäftsideen zu entwickeln und erfolgreich umzusetzen.
Es liegt auf der Hand, dass der Job des Data Scientists kein einfacher ist. Um all die erwähnten Aufgaben erfüllen zu können, braucht es echte Allrounder. Der Job des Data Scientists ist ein Mix aus Mathematiker, Informatiker, Statistiker, Software-Entwickler und Business Process Development Manager. Gefragt sind zudem Experten, deren geistiger Horizont nicht bei der Abteilungsgrenze endet, sondern – im Gegenteil – die Fachbereich-übergreifend denken können. Last but not least sind Data Scientists jene Mitarbeiter, die jenseits aller Betriebsblindheit fähig sind, die richtigen Fragen zu stellen und aus den Antworten die optimalen Schlüsse zu ziehen.
Genau diese richtigen Fragen und optimalen Schlüsse sind es, die eine Big Data-Anwendung erst zum Leben erwecken. Denn Big Data-Tools sind zwar über Jahrzehnte gereifte, höchst intelligente Lösungen. Doch wie bei einem Konzertflügel braucht es den Pianisten, der es versteht, das Potenzial des Instruments auszureizen. Ebenso ist der Umkehrschluss wahr: Der Data Scientist kann seinen Job erst dann zufriedenstellend erledigen, wenn er mit den geeigneten Instrumenten arbeitet.
Genau hier setzen Enterprise Search-Lösungen an, wie zum Beispiel die Search-Appliance InSpire des österreichischen Anbieters Mindbreeze. Sie helfen, die Datenberge, unter denen die überwiegende Mehrheit der Unternehmen leidet, so aufzubereiten, dass der Data Scientist alle für eine Aufgabenstellung relevanten Informationen herausholen kann. Die Bezeichnung “Search” ist in diesem Zusammenhang ein echtes Understatement, denn diese Systeme gehen über eine Suchabfrage, die man von seinem Browser gewohnt ist, weit hinaus. Auf den Punkt gebracht: Enterprise Search verwandelt die unstrukturierte Welt, die aus einer schier unendlichen Menge von Mails, Dokumenten, Videos, Fotos und Audiodateien besteht, in eine strukturierte, in der die genannten Daten in Sinnzusammenhänge gebracht werden. Mit anderen Worten: Aus Goldstaub werden Nuggets.
Zu diesem Zweck stehen dem Data Scientist eine Reihe von Funktionen zur Verfügung, die seit vielen Jahren vor allem in der weltweit agierenden Fach-Community entwickelt werden. Basis einer Enterprise Search-Lösung ist die Indizierung. Eine hochperformante Lösung schafft von vielen Millionen bis zu mehrere Milliarden Dokumente – pro Tag, versteht sich. Die Leistung lässt sich nach Bedarf steigern, durch Clusterung vieler Search Appliances.
Enterprise Search Systeme holen sich während des Indizierungsprozesses aus den unterschiedlichsten Dateiformaten – Top-Systeme unterstützen über 500 Fileformate – und verschiedensten Quellen im gesamten Unternehmen – seien diese in internen Anwendungen, Cloud-Applikationen oder im Web – all jene Informationen, die dem Data Scientist helfen, seinen Job optimal zu erledigen. Auf diese Weise entsteht vor den Augen des Datenspezialisten etwa aus einem vereinzelten Kalendereintrag des Geschäftsführers, einem E-Mail-Attachment, das irgendwo im Archiv der Support-Abteilung verloren scheint, und einer offenen Rechnung am PC des Buchhalters das konkrete Bild eines Kunden, der offensichtlich verärgert ist. Für den Data Scientist der Auftrag, zu veranlassen, dass der Kunde ganz einfach einmal angerufen wird, bevor dieser das Handtuch wirft, um sein Glück beim Mitbewerb zu suchen.
Derartige Beispiele gibt es zu Tausenden und sie werden mit der Weiterentwicklung der Enterprise Search-Lösungen, die insbesondere auch durch die kompetenten Hände eines Data Scientists ihr volles Potenzial ausspielen können, jeden Tag mehr. Die Beispiele reichen von einfachen CRM-Aufgaben bis zu hochkomplexen Prozessthemen, die beispielsweise einem Flughafen helfen, die Gepäckabfertigung so zu optimieren, dass die teuren Stehzeiten der Flugzeuge und die für die Passagiere lästige Wartezeit vor der Gepäckausgabe auf ein Minimum reduziert werden.
Der Mehrwert, den das Gespann Enterprise Search-Lösung und Data Scientist den Unternehmen bringen können, liegt auf der Hand: Mehr Effizienz, Optimierung von Prozessen sowie die Förderung von geschäfts- und umsatzfördernden Erkenntnissen sind nur einige Aspekte, von denen all jene Unternehmen profitieren werden, die mit den geeigneten Maßnahmen den Schritt aus der unstrukturierten Welt in die strukturierte wagen. Wenn das nicht sexy ist, was dann?
Data Scientist werden – aber wo?
Ein Professor hat ein paar interessante Anlaufstellen für Big Data Ausbildung und Weiterbildung im Hochschulbereich zusammengestellt:
http://ibmexperts.computerwoche.de/analytics-big-data/artikel/data-scientist-werden-aber-wo