Categories: SoftwareUnternehmen

IBM präsentiert Suchtechnologie für unstrukturierte Daten

IBM hat jetzt eine Technologie veröffentlicht, die Suche und Textanalyse in unstrukturierten Daten ermöglicht. Die Spezifikation ‘Unstructured Information Management Architechture’ (UIMA) will IBM zudem als Open Source veröffentlichen. Die Architektur stöbert Trends, Fakten und Verbindungen in Mails, Webseiten, Bildern, Textdokumenten sowie Multimedia-Inhalten auf. Über die Entwicklerseiten von Sourceforge wird der Code voraussichtlich gegen Ende des Jahres verfügbar sein, teilt IBM mit.

Anders als die meisten anderen Suchmaschinen, beschränkt sich UIMA nicht nur auf die Suche anhand von Schlagworten, um verschiedene Bedeutungen zu unterscheiden. Das erklärte Nelson Mattos, Vice President of Information Integration bei IBM, im Rahmen der Veröffentlichung auf der LinuxWorld in San Francisco.

Mit der Offenlegung des Codes wolle IBM “eine breite Akzeptanz auf dem Markt” schaffen, erklärte Mattos. Unternehmen, Regierungen und Universitäten sowie unabhängige Softwarehersteller würden dadurch einfacher Anwendungen oder Erweiterungen rund um UIMA entwickeln können.

Das erste kommerzielle Produkt mit UIMA ist mit ‘Information Integrator OmniFind Edition’, einem Teil der WebSphere-Suite, ab sofort erhältlich. Bis andere ISVs (Independent Software Vendors) ihre Anwendungen mit der offenen Architektur kompatibel gemacht haben, werde wohl noch einige Zeit verstreichen, wie einige Analysten vorhersagen.

Bei der etwa vierjährigen Entwicklung waren neben der DARPA Advanced Research Projects Agency des US-Verteidigungsministeriums auch Universitäten und private Forschungseinrichtungen beteiligt. Die Universitäten Carnegie Mellon, Columbia und Massachusetts haben mitentwickelt und setzen nun die Architektur für Forschungszwecke ein. Erst vor wenigen Wochen gab IBM eine Suchtechnologie bekannt, die auch Inhalte in dynamischen Webseiten ausfindig machen kann.

Das Analysieren unstrukturierter Informationen ist so etwas wie der Heilige Gral der Suchtechnologien. Etwa 85 Prozent aller Unternehmensdaten schwirren unstrukturiert außerhalb von Datenbanken herum, schätzen Analysten. Etwa ein Drittel ihrer Zeit verschwenden folglich Angestellte damit, relevante Informationen in der immer größer werdenden Datenflut zu suchen, heißt es von IBM.

“Die Grenze zwischen den strukturierten und den unstrukturierten ‘Welten’ ist noch immer eine der großen Herausforderungen der IT-Industrie. Business Intelligence und Wissensmanagement haben sich jeweils beinahe isoliert von einander entwickelt, und doch haben sie die gleiche Aufgabe – eine klare und verwertbare Sicht auf Datenbestände”, meint Ian Charlesworth, Senior Analyst beim Marktforschungsunternehmen Ovum. In IBMs Technologie sieht er eine Basis, auf welcher der Brückenschlag zwischen den beiden Welten gelingen könnte.

Page: 1 2

Silicon-Redaktion

Recent Posts

GenKI verbessert Datenmanagement und Angebotsgenauigkeit

DHL Supply Chain nutzt generative KI-Anwendungen für Datenbereinigung und präzisere Beantwortung von Angebotsanforderungen (RFQ).

19 Stunden ago

Rolls-Royce Power Systems nutzt industrielle KI aus der IFS Cloud​

Marke mtu will globale Serviceabläufe optimieren und strategische Ziele hinsichtlich Effizienz, Nachhaltigkeit und Wachstum unterstützen.

20 Stunden ago

Thomas-Krenn.AG: viele Pflichten, knappe Ressourcen, mehr freie IT-Welt

IT-Infrastruktur-Trends 2025: Open-Source-Projekte sowie aufwändige regulatorische und Pflichtaufgaben werden das Jahr prägen.

20 Stunden ago

Stadt Kempen nutzt Onsite Colocation-Lösung

IT-Systeme werden vor Ort in einem hochsicheren IT-Safe betrieben, ohne auf bauliche Maßnahmen wie die…

2 Tagen ago

SoftwareOne: Cloud-Technologie wird sich von Grund auf verändern

Cloud-Trends 2025: Zahlreiche neue Technologien erweitern die Grenzen von Cloud Computing.

2 Tagen ago

KI-basierte Herz-Kreislauf-Vorsorge entlastet Herzspezialisten​

Noah Labs wollen Kardiologie-Praxen und Krankenhäuser in Deutschland durch KI-gestütztes Telemonitoring von Patienten entlasten.

2 Tagen ago