Bisherige Bildersuchprogramme beziehen in ihre Suche den mit den Fotos verbundenen Text mit ein. ‘Automatic Linguistic Indexing of Pictures in Real-Time’ (ALIPR) hingegen übersetzt die manuell eingegebene Fotobeschreibung in ein statistisches Modell. Dieses nimmt das System schließlich als Grundlage, um Objekte in nicht beschriebenen Fotos automatisch zu erkennen.

Das System wurde federführend von den Informatikern Jia Li und James Wang entwickelt. Sie hoffen, mit ihrem Ansatz die Treffsicherheit von Bildersuchmaschinen zu verbessern. Der entwickelte Algorithmus greift dabei auf eine vorgefertigte Datenbank mit 60.000 Einträgen zurück. “Wir haben damit angefangen, Bilder manuell zu beschreiben. Dies ist die Grundlage für unser statistisches Modell, auf dessen Basis der Computer Muster erkennt und mit den Schlagwörtern verbinden kann”, erläutert Li. Neue Bilder, die ähnliche Muster aufweisen, werden somit auch mit den Schlüsselwörtern verknüpft.

Das System ordnet jedem Foto mindestens eines und bis zu sieben mögliche Schlagwörter zu, erläutert Li. Dies funktioniert in 90 Prozent der Fälle. ALIPR ist in der Lage, Tiere von Menschen zu unterscheiden. Bei Menschen jedoch erkennt das System nicht, ob es sich um einen Erwachsenen oder um ein Kind handelt, schränkt die Wissenschaftlerin ein. Eine 100-prozentige Treffergenauigkeit ist daher kaum zu erreichen, meinen die Forscher.

Jedoch habe ALIPR ein großes Potenzial, die Bildersuche deutlich zu verbessern – vor allem dann, wenn zusätzliche Suchmechanismen zum Einsatz kommen. So kann zum Beispiel die von Google entwickelte Graphenanalyse-Technik hinzugezogen werden, mit der versucht wird, irrelevante Ergebnisse herauszufiltern. Dabei werden Eigenschaften von digitalen Bildern verglichen und versucht, ein Ranking ähnlich dem von Google eingesetzten Page-Rank zu erstellen.

Um ALIPR zu verbessern, haben die Forscher eine Webseite eingerichtet. Dort können Nutzer Fotos hochladen und mit Stichwörtern versehen. Das Programm selbst schlägt bereits Schlüsselwörter vor, die der Nutzer schließlich ankreuzen kann. Darüber hinaus ist es möglich, eigene Schlagworte hinzuzufügen. Auf diese Weise soll die dem System zugrunde liegende Datenbank umfangreicher und die Bildersuche weiter verbessert werden. Um die Funktionstüchtigkeit des Systems unter Beweis zu stellen, gibt es eine Funktion, um eine in Textform vorliegende Geschichte mit Fotos zu illustrieren.

Silicon-Redaktion

Recent Posts

KI im SEO: So erzielen Sie optimale Ergebnisse

Künstliche Intelligenz gewinnt im Bereich der Suchmaschinenoptimierung zunehmend an Bedeutung. Durch Technologien, die menschliches Verhalten…

1 Stunde ago

Stadt Kempen nutzt Onsite Colocation-Lösung

IT-Systeme werden vor Ort in einem hochsicheren IT-Safe betrieben, ohne auf bauliche Maßnahmen wie die…

22 Stunden ago

SoftwareOne: Cloud-Technologie wird sich von Grund auf verändern

Cloud-Trends 2025: Zahlreiche neue Technologien erweitern die Grenzen von Cloud Computing.

22 Stunden ago

KI-basierte Herz-Kreislauf-Vorsorge entlastet Herzspezialisten​

Noah Labs wollen Kardiologie-Praxen und Krankenhäuser in Deutschland durch KI-gestütztes Telemonitoring von Patienten entlasten.

23 Stunden ago

IBM sieht Nachhaltigkeit als KI-Treiber

Neun von zehn deutschen Managern erwarten, dass der Einsatz von KI auf ihre Nachhaltigkeitsziele einzahlen…

1 Tag ago

Wie KI das Rechnungsmanagement optimiert

Intergermania Transport automatisiert die Belegerfassung mit KI und profitiert von 95 Prozent Zeitersparnis.

2 Tagen ago