Die Lösung identifiziert Dubletten, fehlende Einträge in Datensätzen, fehlerhafte Daten oder unvollständige Adressen und korrigiert sie teilweise automatisch durch Abgleich mit Referenzdatenbanken. So können mit der neuen Open Source Software beispielsweise Spitznamen wie ‘Jo’ oder ‘Hannes’ dem Vornamen ‘Johannes’ zugeordnet werden, wenn zwei Datensätze ansonsten ähnliche Daten enthalten. Talend ist der erste Anbieter von Open Source Datenintegrationssoftware.
Talend Data Quality verfügt über vier zentrale Features: ‘Data Profiling’ misst Verbesserungen oder Verschlechterungen der Datenqualität in einem Unternehmen und stellt die Entwicklung im Zeitverlauf dar. ‘Data Identification’ zeigt die Datenqualität pro Datensatz an. ‘Data Cleansing’ säubert falsche, unvollständige oder inkonsistente Datensätze durch Abgleich mit anderen Datenbanken innerhalb des Unternehmens oder externen Quellen. ‘Data Enrichment’ schließlich reichert Datensätze mit zusätzlichen Daten an, die vom Verwendungszweck im Unternehmen abhängen – denkbar sind beispielsweise geografische Daten, Bonitätsdaten oder demografische Daten. Talend Data Quality wird ab September 2008 als Stand-Alone-Produkt oder als zusätzliches Feature der Talend Integration Suite verfügbar sein.
“So wie heute Informationssysteme miteinander vernetzt sind, verbreiten sich fehlerhafte Daten so schnell wie Viren”, veranschaulicht Bertrand Diard, CEO und Mitbegründer von Talend Open Data Solutions. “So haben inkonsistente Datensätze in der Vergangenheit oftmals dazu geführt, dass Briefe an Kunden verloren gingen oder mehrfach ausgesandt wurden. Dies verärgert Kunden, verschlechtert die Vertriebs-Chancen und die Produktivität in Unternehmen.”
Angriffe auf APIs und Webanwendungen sind zwischen Januar 2023 und Juni 2024 von knapp 14…
Mit täglich über 45.000 eingehenden E-Mails ist die IT-Abteilung des Klinikums durch Anhänge und raffinierte…
Bau- und Fertigungsspezialist investiert in die S/4HANA-Migration und geht mit RISE WITH SAP in die…
Trends 2025: Rasante Entwicklungen bei Automatisierung, KI und in vielen anderen Bereichen lassen Unternehmen nicht…
DHL Supply Chain nutzt generative KI-Anwendungen für Datenbereinigung und präzisere Beantwortung von Angebotsanforderungen (RFQ).
Marke mtu will globale Serviceabläufe optimieren und strategische Ziele hinsichtlich Effizienz, Nachhaltigkeit und Wachstum unterstützen.