Theseus erfolgreich abgeschlossen

“Es sind zahlreiche Patente, innovative Geschäftsmodelle, neuartige Dienste und Technologien entstanden, die besonders kleinen und mittelständischen Unternehmen enormes Potenzial bieten”, sagte Prof. Dr. Hans-Jörg Bullinger, Präsident der Fraunhofer-Gesellschaft. Dabei habe sich Theseus auf standortstarke Wachstumsfelder wie Software, Medizintechnik und Medien konzentriert.

Die Bilanz des Projektes sieht nach eigenen Angaben so aus:

Aktivität
Anzahl
Gegründete Unternehmen 5
Umgesetzte Standardisierungsaktivitäten 19
Initiierte Entwicklungspartnerschaften 19
Eingeworbene Anschlussprojekte 29
Angemeldete Patente und andere geschützte Ergebnisse 50
Entwickelte Prototypen 130
Veröffentlichte Publikationen 1100

Ein Ziel des Forschungsprogramms war es, das Wissen der analogen Welt in Dateien umzuwandeln und so für das Internet überhaupt erst verfügbar zu machen. Das gilt für Bücher und Zeitungen, für Audio- und Videoaufnahmen und auch für Filmrollen, die zu Hunderttausenden in Archiven lagern. In Theseus wurden Verfahren erarbeitet, die diese analogen Datenträger schnell digitalisieren und analysieren. Das ist wichtig, denn bislang gibt es von den wenigsten Dokumenten oder historischen Kunstschätzen Digitalkopien.

Allein für die Deutsche Digitale Bibliothek (DDB) – ein öffentlich gefördertes Projekt, das Kunstwerke, Literatur oder Film- und Tonaufnahmen aus rund 30.000 deutschen Museen und Sammlungen verfügbar machen soll – müssen Hunderttausende Kleinodien erfasst werden. Auch die DDB setzt auf die neue Digitalisierungs-Technologie. Dazu gehören Archivierungs-Programme, die den Inhalt der Medien automatisch verschlagworten und so kodieren, dass Internet-Programme darauf zugreifen können – zum Beispiel in Form von Videos im MPEG4-Standard.

Die neuen Technologien können künftig auch Ärzten helfen. Ultraschall oder Computertomographie sind wichtige Grundlagen für die medizinische Diagnose und Therapie. Bislang gibt es allerdings kein Instrument, das all die damit verbundenen heterogenen Informationen – wie Texte, Bilder oder Labordaten – intelligent strukturiert und zugänglich macht. Im Theseus-Anwendungsszenario MEDICO arbeiteten Forscher daran, diese Lücke zu schließen.

Zu den Theseus-Erfindungen gehört auch die semantische Suchmaschine Quote. Diese ermöglicht es, Zitate von Personen des öffentlichen Interesses zu recherchieren. Als mobil verfügbare Suchmaschine und Überblickshilfe soll Quote in den Bereichen Medien, Öffentlichkeitsarbeit, Sponsoring und Personalmanagement genutzt werden. So kann der User innerhalb der Applikation bestimmten Personen “folgen” oder nach Themen suchen und erhält die letzten Zitate von Personen zum jeweiligen Thema.

Technisch vereint Quote semantische Analysemethoden, die im Theseus-Programm und im Anwendungsszenario Contentus entwickelt wurden: Ein ‘Named Entity Recognizer’ stellt beispielsweise fest, ob das Wort “Becker” etwa für Boris Becker steht oder für einen anderen Herrn Becker. Zudem ist es möglich, einen Steckbrief für Personen zu erstellen, indem aufgezeigt wird, zu welchen Themen die Person in letzter Zeit zitiert wurde.

Der spezielle ‘Topic Modeling’-Algorithmus erstellt dafür ein Themenspektrum aus den Dokumenten der beobachteten Personen. Der ‘Quote Detector’-Algorithmus erkennt die Muster typischer Zitate und extrahiert wahrscheinliche Zitate zu bestimmten Personen aus der bislang mit mehreren 10.000 Nachrichtenartikeln gefüllten Datenbank von Quote. Clustering-Algorithmen verhindern, dass Duplikate entstehen.

Quote befindet sich derzeit am Fraunhofer IAIS in der abschließenden Entwicklung. Bis zur CeBIT wird die Applikation mit weiteren Datenquellen und Analysemöglichkeiten ausgestattet werden und dann erstmals der Öffentlichkeit präsentiert.


Bild: mufin GmbH

Im Theseus-Programm wurde auch am mufin Player gearbeitet – einer Abspiel-Software, die in der Lage ist, Eigenschaften von Musikstücken zu erkennen und so dem Nutzer auf Klangähnlichkeiten basierende Empfehlungen zu geben.

Die Anwendung Analyze von Attensity durchsucht das Social Web mit Hilfe von semantischen Technologien nach relevanten Nutzerkommentaren, zum Beispiel zu einem Mobiltelefon. Aus den Ergebnissen erstellt die Software eine Zusammenfassung, die Unternehmen Rückschlüsse auf die Kundenzufriedenheit und die Produktqualität erlaubt.

Ein Beispiel ist auch die Information Workbench von fluid Operations. Hier werden Technologien des Forschungszentrum Informatik genutzt, um Unternehmen eine Lösung für ihr Informationsmanagement anzubieten. Nach Angaben des Herstellers wird damit zum Beispiel die frühzeitige Fehlererkennung in komplexen Rechenzentren möglich.

Als Katalysator für das Internet der Zukunft soll die Unified Service Description Language (USDL) dienen. Mit ihr wird es möglich, Dienstleistungen einheitlich und für Mensch und Maschine gleichermaßen verständlich zu beschreiben. Online-Services können wie Güter gehandelt und kombiniert werden.

“Theseus hat einiges zusammengebracht”, sagte Prof. Dr. Henning Kagermann im Dezember 2011 gegenüber dem IT-Gipfelblog. Die Frage sei jetzt, ob man es schaffe, genügend Anwender für die entwickelten Techniken zu gewinnen.



Auf der CeBIT präsentiert sich Theseus mit seinen Projektpartnern auf dem Stand des BMWi sowie auf dem ‘CeBIT lab’ in Halle 9. Wer nicht in Hannover sein kann, kann Theseus auch per kostenloser iPad-App näher betrachten.

Silicon-Redaktion

View Comments

  • Dank des Artikels lese ich heute zum ersten Mal von Theseus. Die Ergebnisse sind beeindruckend und werden sicherlich in den nächsten Jahren noch einige Neuerungen mitbringen. Die Entwicklung diesbezüglich ist ja nun wirklich rasant. Auch wenn der Beitrag an sich schon sehr informativ ist, so würden mich ausführlichere Artikel dazu sehr interessieren. Vielleicht ist es ja möglich auf die Thematik noch einmal näher einzugehen? Ich denke auch für viele andere Leser wäre ein „Mehr“ an Informationen interessant.

Recent Posts

Blockaden und Risiken bei APM-Projekten vermeiden

Application Portfolio Management (APM) verspricht Transparenz, mehr IT-Leistung und Effizienz – theoretisch.

1 Tag ago

BSI-Bericht: Sicherheitslage im Cyberraum bleibt angespannt

Im Berichtszeitraum Mitte 2023 bis Mitte 2024 wurden täglich durchschnittlich 309.000 neue Schadprogramm-Varianten bekannt.

2 Tagen ago

KI-Hype in der Cybersicherheit – oder besser doch nicht?

KI kommt in der Cybersicherheit zum Einsatz, etwa um Abweichungen im Netzwerkverkehr zu identifizieren. Ist…

3 Tagen ago

Netzwerksegementierung schützt vor Angriffen über die OT

Ungepatchte und veraltetete Maschinen-Software ist ein beliebtes Einfallstor für Hacker, warnt Nils Ullmann von Zscaler…

3 Tagen ago

KI-Bluff bei AIOps erkennen

Die Auswahl einer Lösung sollte anhand von echten Leistungsindikatoren erfolgen, um echte KI von Behauptungen…

4 Tagen ago

Klinikum Frankfurt an der Oder treibt Digitalisierung voran

Interdisziplinäres Lenkungsgremium mit Experten aus den Bereichen IT, Medizin, Pflege und Verwaltung sorgt für die…

4 Tagen ago