Otto Neuer

ist VP Sales EMEA Central bei Talend.

16. März: Freiheit für die Daten

Über Open Data und der Tag der Informationsfreiheit schreibt heute Otto Neuer, Vice President Sales EMEA Central bei Talend im silicon.de-Blog. 

Der 16. März gilt als Tag der Informationsfreiheit. Die Idee stammt ursprünglich aus den USA, wo sich der Freedom of Information Day auf den Geburtstag von James Madison bezieht: Der vierte Präsident der USA war den Ideen der Aufklärung verpflichtet und gilt als einer der Autoren der Verfassung der Vereinigten Staaten. In Deutschland spiegeln sich diese Ideale in Initiativen für Open Government und Open Data sowie dem Informationsfreiheitsgesetz wider.

Die Informationsfreiheit ist in Deutschland heute ein wichtiges Bürgerrecht: Es gestattet die Einsicht in Dokumente und Akten der öffentlichen Verwaltung. Seit einigen Jahren hilft das Portal https://fragdenstaat.de interessierten Bürgern dabei, ihre Anfragen bequem bei Behörden einzureichen. So hat sich das Portal zu einer Sammelstelle für amtliche Informationen entwickelt. Bei den Bürgerfragen geht es zum Beispiel um die Verwendung von öffentlichen Geldern für die Stadtverwaltung oder wie sich der Fuhrpark von Bundestagsabgeordneten zusammensetzt. Die dort veröffentlichten Informationen zeigen anschaulich, welche vielfältigen und interessanten Daten bei den Behörden schlummern. Aber erst durch Open Data-Initiativen werden daraus auch maschinenlesbare Datenbestände, die sich für eine Weiterverarbeitung durch Dritte eignen.

Maschinenlesbare Daten veröffentlichen

Um die Verbreitung von Daten weiter zu beschleunigen, hat sich die Verwaltung dem Prinzip „Open Data by Default“ verpflichtet. Damit sollen Behörden ermutigt werden, geeignete Daten grundsätzlich öffentlich zu stellen. Für Unternehmen ergibt sich dadurch ein erhebliches wirtschaftliches Potenzial, wenn große Informationsmengen als Open Data verfügbar werden. Zu offenen Daten zählen beispielsweise Geodaten, Statistiken und Forschungsergebnisse, aber auch aktuelle Informationen zum Wetter und zur Verkehrslage. Unternehmen können diese frei verfügbaren Daten mit bestehenden Informationen verknüpfen und so einen Mehrwert schaffen. Ein Beispiel hierfür sind Versicherungen, die Wetterdaten für eine Risikoanalyse verwenden.

Zentrale Anlaufstelle für Open Government in Deutschland ist das GovData-Portal: Hier bieten öffentliche Stellen aus Bund, Ländern und Kommunen vielfältige Daten der Verwaltung an. Beispielsweise hat der Freistaat Bayern bereits über 800 Datensätze in seinem Open Data-Portal bereitgestellt, darunter 200 verschiedene Geodatensätze. Diese informieren über Schutzgebiete, den Breitbandausbau oder über kommunale Bauprojekte und die Lage von Leerrohren. Zum Vergleich: Das unter www.europeandataportal.eu erreichbare Europäische Datenportal referenziert über rund 790.000 Datensätze. Aber auch die Deutsche Bahn bietet erste Open Data-Datensätze und Entwickler haben basierend darauf Apps rund um die Reiseplanung veröffentlicht.

Datenintegration mit der Cloud

Wer als Unternehmen diese Datenschätze für neue Geschäftsmodelle nutzen möchte, hat es heute so einfach wie nie zuvor. Denn: Die Cloud bietet flexibel skalierbare IT-Ressourcen, mit deren Hilfe sich sehr rasch eine leistungsfähige Infrastruktur für das Datenmanagement aufbauen lässt. Von Rechenleistung und Speicherkapazität über SQL- und NoSQL-Datenbanken bis hin zu Cloud-Services für maschinelles Lernen sind heute alle notwendigen IT-Services aus der Cloud verfügbar.

Allerdings sind im ersten Schritt Maßnahmen notwendig, um die Datenintegrität und Datenqualität sicherzustellen. Die bestehende Qualität von frei verfügbaren Daten wird einerseits durch technische Aspekte wie Struktur, Format oder die Einhaltung von Standards definiert, andererseits aber auch durch die Unterstützung von bestehenden Regularien zum Datenschutz. Um jedes Risiko einer Rückverfolgbarkeit von Daten zu Personen zu vermeiden, zwingt die Datenschutzverordnung DSGVO beispielsweise die öffentliche Verwaltung dazu, alle öffentlichen bereitgestellten Datensätze auf sensible Informationen zu prüfen.

Darüber hinaus stehen Organisationen generell vor der Herausforderung, eine Balance zu finden zwischen Datenverfügbarkeit für eine breite Zielgruppe und der Notwendigkeit, kritische Daten zu schützen. Anwendungen für Data Governance und Data Preparation, wie sie beispielsweise von Talend entwickelt werden, helfen Mitarbeiter in der Fachabteilung dabei, Daten auf ihre Qualität zu prüfen, den Zugriffsschutz zu regeln und diese für eine Weiterverarbeitung vorzubereiten. Dazu zählt auch die Datenportabilität zu unterstützen, also die bereitgestellten Daten in einem maschinenlesbaren Format bereitzustellen. Die Data Preparation-Lösung ist Teil der Talend Integration Cloud, mit der Unternehmen ihre bestehenden On-premise-Datensilos mit beliebigen Datenquellen in der Cloud verbinden. Somit schaffen CIOs die Grundlagen, um durch die Kombination von kommerziellen Bestandsdaten mit Open Data neue datenbasierte Geschäftsmodelle zu realisieren. Die damit entwickelten neuen Produkte oder Dienstleistungen treiben wiederum die Wirtschaft an und verbessern im Idealfall unser tägliches Leben. Somit profitiert auch die Gesellschaft insgesamt von dem Tag der Informationsfreiheit.

Weiterführende Links:
European Data Portal
GovData Portal Deutschland
Freedom of Information Day
Open Data Portal Deutsche Bahn