Categories: SoftwareUnternehmen

Tool für semantische Suche kommt bald auf den Desktop

Seit fünf Jahren brütete das Projekt hinter den Mauern des Middlebury College im US-Bundesstaat Vermont, doch in den nächsten Wochen wollen die Forscher unter der GPL (General Public License) eine Version für den Desktop veröffentlichen.

Die Einfachste Form einer semantischen Suche ist die Indexierung von Synonymen. Ein weiterer Schritt ist die Suche über Wortgruppen oder Wortfamilien. So würde die Sucheingabe ‘Hund’ auch Ergebnisse zum Beispiel mit ‘Pudel’ oder ‘Labrador’ liefern. Nächsten Monat will Aaron Coburn, der Leiter des Projektes ‘Semantic Indexing’ unter dem Namen ‘Standalone Engine’ eine Version für den Desktop vorstellen.

In einigen Projekten hat Coburn die neuen Möglichkeiten einer bedeutungsbasierten Suche vorgestellt, vor allem in Bereichen akademischen Forschung. In einem nächsten Schritt will Coburn möglichst viele elektronische Texte in einer Datenbank erfassen.

Doch das Projekt soll noch weiter gehen. Coburn hat auch eine Visualisierung integriert. So visualisiert die Software zum Beispiel Romane. In einem ersten Projekt haben die Forscher aus Middlebury in Zusammenarbeit mit einem spanischen Lehrstuhl einen elektronischen Reader von Cervantes’ Don Quixote erarbeitet, der sich auf bestimmte Muster hin durchsuchen lässt.

Erste Gehversuche unternahm das Projekt mit den Romanen von Jane Austen. Ein Tool sorgt für die Visualisierung der einzelnen Charakteren in den Romanen. Ein Algorithmus stellt dann Bezüge zwischen den Personen in den einzelnen Werken dar. Dieser Algorithmus sei inzwischen schon so weit ausgereift, dass sich die Bezüge zwischen den Personen relativ treffsicher darstellen lassen, heißt es von dem Projekt.

Ein zweites Einsatzgebiet ist ein Crawler, der Blog-Seiten indexiert. Das ‘Discourse Analytic Project’ indexiert Tausende dieser oft meinungsgetriebenen Seiten und visualisiert hier Schlagworte und bestimmte Textmuster.

Gegenüber dem Branchendienst Newsforge erklärte Coburn: “Ich hoffe, dass diese Tools uns helfen werden, eine andere Sichtweise auf Daten zu bekommen und Muster in Texten zu finden, die uns mit einer Schlagwortsuche bisher verborgen geblieben sind.”

Silicon-Redaktion

Recent Posts

Krebsforschungszentrum will Grenzen der Krebsforschung KI-gestützt erweiternKrebsforschungszentrum will Grenzen der Krebsforschung KI-gestützt erweitern

Krebsforschungszentrum will Grenzen der Krebsforschung KI-gestützt erweitern

The Royal Marsden NHS Foundation Trust hat gemeinsam mit NTT DATA und der KI-Plattform CARPL.ai…

1 Tag ago
Rossmann entscheidet sich für Microsoft Azure Red Hat OpenShiftRossmann entscheidet sich für Microsoft Azure Red Hat OpenShift

Rossmann entscheidet sich für Microsoft Azure Red Hat OpenShift

Drogeriekette will Anwendungen flexibel auf Infrastrukturen on-premises und in der Cloud bereitstellen, um Flexibilitäts- und…

1 Tag ago
Backup-Täuschung: Warum Cloud-Wiederherstellung das neue Cyber-Blindfeld istBackup-Täuschung: Warum Cloud-Wiederherstellung das neue Cyber-Blindfeld ist

Backup-Täuschung: Warum Cloud-Wiederherstellung das neue Cyber-Blindfeld ist

Cloud-Backups gelten als Versicherungspolice des digitalen Zeitalters, was nicht mehr stimmt, warnt Max Heinemeyer von…

2 Tagen ago

Cyberangriffe im KI-Zeitalter: Warum Resilienz und Sicherheitskultur entscheidend sind

Mitarbeiter spielen eine entscheidende Rolle für die Cyber-Resilienz eines Unternehmens, sagt Dr. Martin J. Krämer…

3 Tagen ago

KI-Agenten erfolgreich integrieren

Doch trotz steigendem Interesse wissen viele Unternehmen nicht, wo sie anfangen sollen, um KI-Agenten sinnvoll…

4 Tagen ago

Plusnet: Innovative Analytics mit Microsoft Fabric

Fabric hilft Plusnet bei der Etablierung einer stringenten Datenkultur und ermöglicht es den Fachbereichen, geschäftlichen…

4 Tagen ago