Bisherige Bildersuchprogramme beziehen in ihre Suche den mit den Fotos verbundenen Text mit ein. ‘Automatic Linguistic Indexing of Pictures in Real-Time’ (ALIPR) hingegen übersetzt die manuell eingegebene Fotobeschreibung in ein statistisches Modell. Dieses nimmt das System schließlich als Grundlage, um Objekte in nicht beschriebenen Fotos automatisch zu erkennen.

Das System wurde federführend von den Informatikern Jia Li und James Wang entwickelt. Sie hoffen, mit ihrem Ansatz die Treffsicherheit von Bildersuchmaschinen zu verbessern. Der entwickelte Algorithmus greift dabei auf eine vorgefertigte Datenbank mit 60.000 Einträgen zurück. “Wir haben damit angefangen, Bilder manuell zu beschreiben. Dies ist die Grundlage für unser statistisches Modell, auf dessen Basis der Computer Muster erkennt und mit den Schlagwörtern verbinden kann”, erläutert Li. Neue Bilder, die ähnliche Muster aufweisen, werden somit auch mit den Schlüsselwörtern verknüpft.

Das System ordnet jedem Foto mindestens eines und bis zu sieben mögliche Schlagwörter zu, erläutert Li. Dies funktioniert in 90 Prozent der Fälle. ALIPR ist in der Lage, Tiere von Menschen zu unterscheiden. Bei Menschen jedoch erkennt das System nicht, ob es sich um einen Erwachsenen oder um ein Kind handelt, schränkt die Wissenschaftlerin ein. Eine 100-prozentige Treffergenauigkeit ist daher kaum zu erreichen, meinen die Forscher.

Jedoch habe ALIPR ein großes Potenzial, die Bildersuche deutlich zu verbessern – vor allem dann, wenn zusätzliche Suchmechanismen zum Einsatz kommen. So kann zum Beispiel die von Google entwickelte Graphenanalyse-Technik hinzugezogen werden, mit der versucht wird, irrelevante Ergebnisse herauszufiltern. Dabei werden Eigenschaften von digitalen Bildern verglichen und versucht, ein Ranking ähnlich dem von Google eingesetzten Page-Rank zu erstellen.

Um ALIPR zu verbessern, haben die Forscher eine Webseite eingerichtet. Dort können Nutzer Fotos hochladen und mit Stichwörtern versehen. Das Programm selbst schlägt bereits Schlüsselwörter vor, die der Nutzer schließlich ankreuzen kann. Darüber hinaus ist es möglich, eigene Schlagworte hinzuzufügen. Auf diese Weise soll die dem System zugrunde liegende Datenbank umfangreicher und die Bildersuche weiter verbessert werden. Um die Funktionstüchtigkeit des Systems unter Beweis zu stellen, gibt es eine Funktion, um eine in Textform vorliegende Geschichte mit Fotos zu illustrieren.

Silicon-Redaktion

Recent Posts

Blockaden und Risiken bei APM-Projekten vermeiden

Application Portfolio Management (APM) verspricht Transparenz, mehr IT-Leistung und Effizienz – theoretisch.

2 Tagen ago

BSI-Bericht: Sicherheitslage im Cyberraum bleibt angespannt

Im Berichtszeitraum Mitte 2023 bis Mitte 2024 wurden täglich durchschnittlich 309.000 neue Schadprogramm-Varianten bekannt.

3 Tagen ago

KI-Hype in der Cybersicherheit – oder besser doch nicht?

KI kommt in der Cybersicherheit zum Einsatz, etwa um Abweichungen im Netzwerkverkehr zu identifizieren. Ist…

3 Tagen ago

Netzwerksegementierung schützt vor Angriffen über die OT

Ungepatchte und veraltetete Maschinen-Software ist ein beliebtes Einfallstor für Hacker, warnt Nils Ullmann von Zscaler…

4 Tagen ago

KI-Bluff bei AIOps erkennen

Die Auswahl einer Lösung sollte anhand von echten Leistungsindikatoren erfolgen, um echte KI von Behauptungen…

4 Tagen ago

Klinikum Frankfurt an der Oder treibt Digitalisierung voran

Interdisziplinäres Lenkungsgremium mit Experten aus den Bereichen IT, Medizin, Pflege und Verwaltung sorgt für die…

5 Tagen ago