TU-Informatiker arbeiten an intelligenter Suchsoftware

“Was schützt meinen Computer vor Trojaner-Attacken?” oder “Wie finde ich einen guten Kindergarten?” – herkömmliche Suchmaschinen liefern oftmals Tausende Webseiten auf eine Frage. Darin die gesuchte Antwort zu finden, bleibt dem Suchenden überlassen. Obwohl fast alle Internet-Nutzer Suchmaschinen benutzen, finden nur wenige die relevanten Informationen beim ersten Suchversuch.

Kollaborativ erstellte Frage-Antwort-Plattformen im Web 2.0 können das nach Meinung von Darmstädter Informatikern ändern. In diesen Plattformen fänden sich selbst auf schwierigste Fragen Antworten höchster Qualität, hieß es. Die Popularität von Frage-Antwort-Plattformen, wie beispielsweise Yahoo!Answers, WikiAnswers oder AnswerBag, sei beachtlich. So zähle WikiAnswers mittlerweile mehr als eine Million Fragen, die in verschiedene inhaltliche Kategorien eingeteilt sind.

Doch die Suche nach Antworten in diesen Frage-Antwort-Wissensspeichern sei immer noch eine Suche nach der Nadel im Heuhaufen. Zum einen mache es die Menge an Informationen dem Nutzer schwer, dort zu navigieren. Zum anderen würden inhaltlich identische oder sehr verwandte Fragen oft in unterschiedliche Worte gefasst und könnten deshalb mit herkömmlichen Suchmaschinenverfahren nicht gefunden werden.

In dem Forschungsprojekt wollen sich die Wissenschaftler des ‘Ubiquitous Knowledge Processing Lab’ (UKP) an der TU Darmstadt dieser Herausforderung annehmen. Sie entwickeln intelligente Algorithmen im Bereich der automatischen Sprachverarbeitung, die unterschiedlich formulierte Fragen mit ähnlicher Bedeutung in den Frage-Antwort-Plattformen automatisch aufspüren.

Existiert bereits eine Antwort auf die gestellte Frage, wird diese dem Fragesteller unmittelbar angezeigt. Sollte eine Frage noch nie beantwortet worden sein, werden elektronische Dokumente im Internet durchsucht, um die Antworten dort aufzuspüren. Dabei werden verschiedene Wörter, die das Gleiche bedeuten, auf einen Suchbegriff abgebildet. Fragt etwa der Suchende nach “einem Programm, um den Computer vor Viren zu schützen”, werden relevante Dokumente zurückgeliefert, die den Begriff “Antiviren-Software” enthalten.

Um die menschliche Sprachintelligenz nachzubilden, werten die Darmstädter Forscher kollaborativ erstellte Web 2.0-Wissensquellen automatisch aus – wie die Online-Enzyklopädie Wikipedia oder das multilinguale Wörterbuch Wiktionary – und machen das daraus destillierte Wissen den Sprachanalyseprogrammen zugänglich.

Das vor wenigen Monaten begonnene Projekt wird von der Computerlinguistin Iryna Gurevych geleitet. Die 31-Jährige Wissenschaftlerin ist Leiterin des UKP Labs im Fachbereich Informatik der TU Darmstadt. Das Projektteam besteht übrigens ausschließlich aus Frauen – ungewöhnlich in einem technischen Fach.

Silicon-Redaktion

Recent Posts

BSI-Bericht: Sicherheitslage im Cyberraum bleibt angespannt

Im Berichtszeitraum Mitte 2023 bis Mitte 2024 wurden täglich durchschnittlich 309.000 neue Schadprogramm-Varianten bekannt.

3 Stunden ago

KI-Hype in der Cybersicherheit – oder besser doch nicht?

KI kommt in der Cybersicherheit zum Einsatz, etwa um Abweichungen im Netzwerkverkehr zu identifizieren. Ist…

11 Stunden ago

Netzwerksegementierung schützt vor Angriffen über die OT

Ungepatchte und veraltetete Maschinen-Software ist ein beliebtes Einfallstor für Hacker, warnt Nils Ullmann von Zscaler…

1 Tag ago

KI-Bluff bei AIOps erkennen

Die Auswahl einer Lösung sollte anhand von echten Leistungsindikatoren erfolgen, um echte KI von Behauptungen…

1 Tag ago

Klinikum Frankfurt an der Oder treibt Digitalisierung voran

Interdisziplinäres Lenkungsgremium mit Experten aus den Bereichen IT, Medizin, Pflege und Verwaltung sorgt für die…

2 Tagen ago

Pentesting: Vom Luxus zum Standard

Automatisierung macht Pentesting auch für kleinere Unternehmen erschwinglich, sagt Mareen Dose von indevis.

4 Tagen ago