Theseus entwickelt semantische Suche ‘Quote’
Das Theseus-Innovationszentrum in Berlin hat eine Neuerung aus dem Theseus-Programm vorgestellt: die semantische Suchmaschine ‘Quote’. Diese ermöglicht es, Zitate von Personen des öffentlichen Interesses zu recherchieren.
Als mobil verfügbare Suchmaschine und Überblickshilfe soll Quote in den Bereichen Medien, Öffentlichkeitsarbeit, Sponsoring und Personalmanagement genutzt werden. So kann der User innerhalb der Applikation bestimmten Personen “folgen” oder nach Themen suchen und erhält die letzten Zitate von Personen zum jeweiligen Thema.
Technisch vereint Quote semantische Analysemethoden, die im Theseus-Forschungsprogramm und im Anwendungsszenario Contentus entwickelt wurden: Ein ‘Named Entity Recognizer’ stellt beispielsweise fest, ob das Wort “Becker” etwa für Boris Becker steht oder für einen anderen Herrn Becker. Zudem ist es möglich, einen Steckbrief für Personen zu erstellen, indem aufgezeigt wird, zu welchen Themen die Person in letzter Zeit zitiert wurde.
Der spezielle ‘Topic Modeling’-Algorithmus erstellt dafür ein Themenspektrum aus den Dokumenten der beobachteten Personen. Der ‘Quote Detector’-Algorithmus erkennt die Muster typischer Zitate und extrahiert wahrscheinliche Zitate zu bestimmten Personen aus der bislang mit mehreren 10.000 Nachrichtenartikeln gefüllten Datenbank von Quote. Clustering-Algorithmen verhindern, dass Duplikate entstehen.
Quote befindet sich derzeit am Fraunhofer IAIS in der abschließenden Entwicklung. Bis zur CeBIT 2012 wird die Applikation mit weiteren Datenquellen und Analysemöglichkeiten ausgestattet werden und dann erstmals der Öffentlichkeit präsentiert.