Schneller ans Ziel: Verkehrsbetriebe San Francisco managen Mobilitätsdaten mit Software von Disy
Spatial-ETL-Plugin von Disy sorgt beim Datenmanagement mit der Talend-Software für integrierte Daten und beschleunigte Prozesse.
Von der Bay bis in die Hügel: Die San Francisco Municipal Transportation Agency (SFMTA), San Franciscos Verkehrsbetriebe, setzen für das Management ihrer Mobilitätsdaten auf eine einheitliche Datenverarbeitung mit einer Lösung von Disy und Talend. Das Plug-in GeoSpatial Integration für Talend Real-Time Big Data sorgt dabei für die einfache Integration von Geodaten. Im Tandem beschleunigt die Lösung die Prozesse für die vielfältigen SFMTA-Services.
Rund 800.000 Menschen wohnen in San Francisco, nahezu 9,5 Millionen Menschen leben in der Bay Area an der Westküste der USA. Täglich nutzen Hundertausende Einwohner und Pendler, die aus den umliegenden Bezirken in die Stadt kommen, das Nahverkehrssystem und die Services der San Francisco Municipal Transportation Agency (SFMTA). Baustellen und Verkehrsstörungen sind an der Tagesordnung. Um diese örtlichen Hemmnisse real zu überwinden, arbeitet die SFMTA mit einem ausgeklügelten Datensystem. In einem sogenannten Data Lake fließen alle verfügbaren Daten zusammen. Es handelt sich dabei um Daten aus den einzelnen Ereignissen (Unfälle, Zustiege zu den einzelnen Transportmitteln, temporäre Baustellen), aber auch um alle Daten zur Lage der einzelnen Haltestellen, temporär geschlossenen Haltestellen bis hin zur Lage von Bordsteinen, die die Haltestellen begrenzen. Auch die Daten aus der Nutzung der e-Scooter fließen beispielsweise ein. Das Datenmanagement wird in der Software Talend Real-Time Big Data betrieben.
Schneller ans Ziel dank integrierter Geodaten und -operationen
Dank des Spatial-ETL-Plug-ins GeoSpatial Integration für Talend, das von der Disy Informationssysteme GmbH in Karlsruhe entwickelt wurde, werden Geodaten in die von der SFMTA eingesetzten Datenmanagement-Plattform Talend nahtlos integriert. Damit können alle Daten einschließlich Geodaten innerhalb einer Plattform einheitlich verarbeitet. Rund 21.000 Fahrten kommen allein mit e-Scooter pro Tag zusammen. 700.000 sogenannte Boardings werden pro Tag in anderen Teilen des Systems erfasst.
Das Plug-in fügt sich dafür nahtlos in die Oberfläche von Talend ein und bringt fertig einsetzbare Geooperationen mit, die per Drag-and-drop für den Spatial-ETL-Job übernommen und in den Workflow eingesetzt werden. Direkt im Integrations- und Transformationsprozess lassen sich so Flächen oder Längen berechnen, Geometrien verschneiden sowie Puffer und konvexe Hüllen oder Bounding-Boxen bilden. Schnell werden Geometrien auf Validität geprüft oder die Distanz zwischen ihnen gemessen. Die Datenverarbeitung und Modellierung findet in nur einer Managementplattform statt. Die Qualität der Daten ist sehr hoch.
Durchgehend hohe Qualität der Mobilitätsdaten
Informationen über Reisewege, Verfügbarkeit und Nutzungsmuster werden effizient erzeugt und verarbeitet. Zusätzliche Geodatenbanken werden zur Berechnung und Verarbeitung nicht mehr benötigt, da die räumliche Verarbeitung der Daten direkt im Prozess durchgeführt wird. Wassilios Kazakos, Leiter Marketing und Business Development, freut sich über den nutzenstiftenden Einsatz der Disy-Software bei den Verkehrsbetrieben von San Francisco: „Die SFMTA ist mit dem Plug-in in der Lage, ihren Kunden eine durchgehend hohe, kontrollierbare Qualität der Mobilitätsdaten mit wesentlich schnelleren und effizienteren Prozessen bereitzustellen. Damit ist GeoSpatial Integration für Talend gemeinsam mit der Software Talend perfekt für alle Unternehmen, die Geodaten und Daten mit Ortsbezug, wie Standorte, Flächen, Verkehrswege etc. verarbeiten und nutzen“, führt Wassilios Kazakos weiter aus.
Zeitersparnis durch direkte Integration von Geodatenquellen
Das Disy-Plug-in für die Talend-Plattform ist deshalb ideal, weil es direkte Einbindungsmöglichkeiten für gängige Geodatenquellen bereithält; Umwege werden vermieden. So werden die Datenquellen und -banken von PostGIS, Oracle Locator und Oracle Spatial, SpatiaLite, ArcGIS Server, Shapefile sowie GeoJSON direkt unterstützt. Dies spielt insbesondere beim Aufbau von ETL-/ELT-Prozessen und Data-Warehouse-Lösungen, aber auch für die Integration von Streaming-Big-Data oder der Datenverarbeitung in der Cloud eine wichtige Rolle.
Ausweitung auf Echtzeitdaten geplant
Die SFMTA verarbeitet mit Talend und GeoSpatial Integration für Talend zurzeit Daten gemäß der Mobility Data Specification (MDS) der Fahrzeugarten e-Scooter, Fahrräder sowie Mopeds und erzeugt bzw. managt Informationen über Reisewege, Verfügbarkeit und Nutzungsmuster. Die finalen Daten werden über zwei Schnittstellen weiteren Anwendungen zur Verfügung gestellt. Die zu verarbeitende Datenmenge ist enorm: Rund 100.000 Transaktionen werden pro Tag durchgeführt. Die SFMTA geht von einem künftigen Anstieg der Transaktionen auf 200.000 pro Tag aus. Für die Zukunft ist der Einsatz der Daten im Echtzeitmodus geplant. Die benötigten Reaktionszeiten liegen je nach Service zwischen einer Subsekunde und 30 Sekunden. Mit GeoSpatial Integration für Talend sind die Verkehrsbetriebe San Francisco dafür bestens gerüstet.
Spatial-ETL-Plug-in kostenfrei herunterladen und testen
Unternehmen, Behörden und andere Organisationen, die sich für das Spatial-ETL-Plug-in interessieren, können es kostenfrei von der Disy-Webseite für den Einsatz mit Talend Open Studio herunterladen und ausprobieren.