Wissenschaftler beseitigen Web 2.0-Werbemüll

Spam, als unerwünschte Werbung und bislang vor allem ein Problem bei der Nutzung von E-Mails, dringt immer mehr auch in die Netzwerke des Mitmach-Web-2.0 vor: Wer sich bei Facebook, Twitter und anderen Internet-Diensten auf die Suche nach Experten-Informationen und Trends macht, stößt immer häufiger auf werbliche Inhalte, die Profi-Spammer dort platzieren.

“Mit dieser Wechselwirkung bevorzugen wir somit eindeutig die Qualität vor der Quantität”, ergänzt Meinel, der das HPI und dessen Fachgebiet Internet-Technologien und -Systeme leitet. Das zweite wichtige Kriterium dieses neuen Ansatzes ist die Aktualität: Wer eine qualitativ hochwertige Information im Web früher als andere Internetnutzer entdeckt und auf sie verweist, dem gibt das Programm einen Bonus. “Wir suchten in einem Test mit unserem neuen SPEAR-Algorithmus die Delicious-Seiten nach Experten für eine Programmiersprache ab und fanden dabei unter den ersten 200 Listenplätzen nicht einen einzigen Spammer. Andererseits stufte SPEAR zwei professionelle Software-Entwickler als die beiden besten Experten für dieses Gebiet ein”, berichtet Noll.

Der Ansatz der beiden deutschen Informatiker und ihrer britischen Kollegen Ching-man Au Yeung, Dr. Nicholas Gibbins und Prof. Nigel Shadbolt (Universität Southampton) kann zum Beispiel helfen, die individuellen Kaufempfehlungen des Online-Händlers Amazon passgenauer zu machen – durch Zusatzinformationen zum Kaufverhalten oder zu Produktrezensionen von Kunden. Oder Nutzer eines Musikdienstes wie Last.fm können verbesserte Empfehlungen bekommen, die sich stärker an ihren Hörgewohnheiten orientieren. Gewissermaßen als Nebenprodukt filtert der SPEAR-Algorithmus Spammer heraus. Profis wird es dadurch sehr schwer gemacht, unerwünschte Werbung noch an prominenter Stelle auftauchen zu lassen.

Der Einsatzbereich von SPEAR ist jedoch nicht auf Online-Dienste beschränkt. Künftig könnte die neu entwickelte Analyse-Software auch dabei helfen, die Expertise von Forschern anhand ihrer wissenschaftlichen Veröffentlichungen zu untersuchen. “Ob gedruckt oder online – solche Publikationen enthalten alle notwendigen Informationen, um den SPEAR-Algorithmus erfolgreich anzuwenden”, betont Meinel. SPEAR ist eine für den speziellen Verwendungszweck angepasste Weiterentwicklung des in Fachkreisen bekannten Algorithmus HITS (Hyperlink-Induced Topic Search) zum Ranking von Webseiten. Professor Jon Kleinberg (Cornell University) hatte ihn 1999 entwickelt.