Google-Forscher entwickeln neue Bilder-Suche
Google-Forscher haben eine Technologie entwickelt, mit der Bildern im Internet ein Ranking zugewiesen werden kann. Sie verbindet eine inhaltliche Analyse von Bildern mit einem System auf Basis des PageRank-Algorithmus für Webseiten, um die Wichtigkeit der Inhalte zu bewerten.
Die Forschungsarbeit ‘PageRank for Product Image Search’ wurde auf der International World Wide Web Conference in Peking vorgestellt. Informell werde das System “VisualRank” genannt, berichtet die New York Times. In einem Test hat sich der Ansatz laut Forschern bewährt, weshalb sie die Methode weiterentwickeln wollen.
“Kommerzielle Suchmaschinen verlassen sich für das Ranking oft ausschließlich auf Texthinweise der Webseiten, in die Bilder eingebunden sind”, erklären Yushi Jing und Shumeet Baluja in ihrer Arbeit. Ihr System dagegen nutzt einen Algorithmus, der viele einzelne Eigenschaften von Bildern vergleicht, um deren Ähnlichkeit zu bewerten und darauf basierend Rankings zu erstellen. Die Graphenanalyse-Techniken, die dabei zum Einsatz kommen, ähneln den Forschern zufolge jenen, mit denen PageRank Webseiten bewertet. Bei Tests des Systems konnte die Anzahl irrelevanter Bilder in den erstgereihten Suchergebnissen gegenüber der aktuellen Google-Bildersuche meist reduziert werden.
Für die Forschungsarbeit ‘PageRank for Product Image Search’ hatte sich das Team allerdings auf 2000 der beliebtesten Produktsuchanfragen beschränkt, darunter etwa iPod, Zune und Xbox. Das lag am gewaltigen Rechenaufwand, der mit der Analyse und dem Vergleich von Bildern nach dieser Methode verbunden ist. Die Milliarden Bilder, die beispielsweise in Googles Bildersuche erfasst sind, derart zu verarbeiten sei vom Rechenaufwand her unrealistisch, so die Forscher.
Die Methode der PageRank-artigen Bildbewertung sei gut für Anwendungen geeignet, bei denen ein winziges Set von Bildern aus einer sehr großen Zahl von Kandidaten herausgefiltert werden muss, sind die Forscher überzeugt. Sie wollen an der Methode weiter forschen und haben dabei insbesondere die Frage im Auge, ob viele identische oder fast identische Bilder genutzt werden könnten, um Suchergebnisse zu beeinflussen.