Das Team der Forscher an der UW kann bereits auf erste Ergebnisse verweisen. “Zoetrope lässt Anwender dabei Informationen tatsächlich im Kontext einer Webseite suchen”, betonte UW-Computerwissenschaftler Eytan Adar. Die Entwicklung setzt dazu auf regelmäßige Schnappschüsse des Zustands von Webseiten als Datenquelle. Sie soll sich aber deutlich von bisherigen Angeboten zur Nachforschung im historischen Web wie der Wayback Machine des Internet Archive abheben.

Im modernen Web sehen Nutzer nur den aktuellen Ist-Zustand von Webseiten, in dem mit verschiedensten Werkzeugen Daten gesucht, manipuliert und visualisiert werden können. “Da ist es schon irgendwie überraschend, dass es keine vergleichbaren Möglichkeiten für das vergängliche Web gibt”, so Dan Weld, Professor für Computerwissenschaften an der UW. Das wollen die Forscher mit Zoetrope ändern und dabei auch deutlich über einfache Stichwortsuchen hinaus gehen. “Bei Zoetrope kann der Nutzer ‘Linsen’ auf Bereiche der Webseite zeichnen, um dadurch Fragen zu historischen Inhalten zu stellen”, erklärte Adar. Wer sich etwa für Verkehrsentwicklung interessiert, könne leicht alte Versionen einer entsprechenden Webseite ansehen und die Daten auch visualisieren. Auch ein Quervergleich verschiedener Webseiten ist mit Zoetrope möglich, beispielsweise von Öl- und Benzinpreisen mit entsprechenden Nachrichtenmeldungen.

Die Forscher hoffen, Zoetrope bereits im kommenden Sommer frei verfügbar machen zu können. Die historische Web-Suche soll möglichst als Browser-Plug-in oder Software-as-a-Service angeboten werden. “Das ideale Anwendungsszenario wäre, dass Anwender ganz normal im Web surfen und bei Bedarf Fragen zu historischen Informationen stellen können, ohne den Browser zu verlassen”, erklärt Adar auf Nachfrage von pressetext. Vorstellbar ist den Forschern zufolge beispielsweise ein Schieberegler, mit dem Nutzer einfach immer weiter in die Vergangenheit einer Webseite spähen können. Derzeit speichert Zoetrope stündlich Schnappschüsse von rund 1000 verschiedenen Webseiten. Adar will eruieren, wie das Programm auf das gesamte Web ausgeweitet werden kann und arbeitet auch daran festzustellen, wie regelmäßig verschiedene Seiten gespeichert werden müssen. Langfristig könnte Zoetrope das aufgrund der Aktualisierungsfrequenz von Webseiten automatisch bestimmen.

Eine Einschränkung von Zoetrope ist, dass erst seit rund vier Monaten Daten gesammelt werden. “Wir würden sehr gerne Zoetrope mit den Daten der Wayback Machine integrieren”, meint Adar daher zu pressetext. Es müssten aber wohl diverse Copyright-Fragen geklärt werden, um diesen Datenschatz nutzen zu können. Das Internet Archive sammelt bereits seit 1996 historische Webdaten und hat Schnappschüsse von 85 Milliarden Webseiten, die im heutigen Web teils gar nicht mehr existieren. Ein wirklich effizientes Werkzeug zum Durchforsten und Auswerten dieser Datensammlung ist die Wayback Machine allerdings nicht, da sie lediglich den Aufruf einzelner Schnappschüsse einer bekannten URL erlaubt.

Silicon-Redaktion

Recent Posts

Zwischen Safety und Security: Balanceakt der Industriesicherheit

Die Vernetzung in der Industrie optimiert mit KI Prozesse und reduziert mit Predictive Maintenance ungeplante…

9 Stunden ago

KI-Reifegrad-Studie: Viele Unternehmen stehen noch am Anfang

Enterprise AI Maturity Index von ServiceNow: Im Durchschnitt erreichen Unternehmen nur einen KI-Reifegrad von 44…

10 Stunden ago

Das Wiederaufleben USB-basierter Angriffe

Wer auf Wechselmedien – wie USB-Laufwerke – angewiesen ist, muss wachsam bleiben, da diese Geräte…

10 Stunden ago

KI in Unternehmen – Die Zukunft der Digitalisierung

Das Thema künstliche Intelligenz wird immer relevanter. Diese Technologie hat Einfluss auf Arbeitsweisen, Politik und…

11 Stunden ago

S/4HANA-Migration: Verzögerung vorprogrammiert?

SAP S/4HANA-Transformationen sind äußerst komplex und verlaufen oft nicht wie geplant – oder scheitern sogar…

1 Tag ago

Black Friday: Ein Blick auf den Schnäppchen-Hype

Der Black Friday, der in den USA traditionell am Freitag nach Thanksgiving gefeiert wird, hat…

1 Tag ago