Das Team der Forscher an der UW kann bereits auf erste Ergebnisse verweisen. “Zoetrope lässt Anwender dabei Informationen tatsächlich im Kontext einer Webseite suchen”, betonte UW-Computerwissenschaftler Eytan Adar. Die Entwicklung setzt dazu auf regelmäßige Schnappschüsse des Zustands von Webseiten als Datenquelle. Sie soll sich aber deutlich von bisherigen Angeboten zur Nachforschung im historischen Web wie der Wayback Machine des Internet Archive abheben.

Im modernen Web sehen Nutzer nur den aktuellen Ist-Zustand von Webseiten, in dem mit verschiedensten Werkzeugen Daten gesucht, manipuliert und visualisiert werden können. “Da ist es schon irgendwie überraschend, dass es keine vergleichbaren Möglichkeiten für das vergängliche Web gibt”, so Dan Weld, Professor für Computerwissenschaften an der UW. Das wollen die Forscher mit Zoetrope ändern und dabei auch deutlich über einfache Stichwortsuchen hinaus gehen. “Bei Zoetrope kann der Nutzer ‘Linsen’ auf Bereiche der Webseite zeichnen, um dadurch Fragen zu historischen Inhalten zu stellen”, erklärte Adar. Wer sich etwa für Verkehrsentwicklung interessiert, könne leicht alte Versionen einer entsprechenden Webseite ansehen und die Daten auch visualisieren. Auch ein Quervergleich verschiedener Webseiten ist mit Zoetrope möglich, beispielsweise von Öl- und Benzinpreisen mit entsprechenden Nachrichtenmeldungen.

Die Forscher hoffen, Zoetrope bereits im kommenden Sommer frei verfügbar machen zu können. Die historische Web-Suche soll möglichst als Browser-Plug-in oder Software-as-a-Service angeboten werden. “Das ideale Anwendungsszenario wäre, dass Anwender ganz normal im Web surfen und bei Bedarf Fragen zu historischen Informationen stellen können, ohne den Browser zu verlassen”, erklärt Adar auf Nachfrage von pressetext. Vorstellbar ist den Forschern zufolge beispielsweise ein Schieberegler, mit dem Nutzer einfach immer weiter in die Vergangenheit einer Webseite spähen können. Derzeit speichert Zoetrope stündlich Schnappschüsse von rund 1000 verschiedenen Webseiten. Adar will eruieren, wie das Programm auf das gesamte Web ausgeweitet werden kann und arbeitet auch daran festzustellen, wie regelmäßig verschiedene Seiten gespeichert werden müssen. Langfristig könnte Zoetrope das aufgrund der Aktualisierungsfrequenz von Webseiten automatisch bestimmen.

Eine Einschränkung von Zoetrope ist, dass erst seit rund vier Monaten Daten gesammelt werden. “Wir würden sehr gerne Zoetrope mit den Daten der Wayback Machine integrieren”, meint Adar daher zu pressetext. Es müssten aber wohl diverse Copyright-Fragen geklärt werden, um diesen Datenschatz nutzen zu können. Das Internet Archive sammelt bereits seit 1996 historische Webdaten und hat Schnappschüsse von 85 Milliarden Webseiten, die im heutigen Web teils gar nicht mehr existieren. Ein wirklich effizientes Werkzeug zum Durchforsten und Auswerten dieser Datensammlung ist die Wayback Machine allerdings nicht, da sie lediglich den Aufruf einzelner Schnappschüsse einer bekannten URL erlaubt.

Silicon-Redaktion

Recent Posts

Studie: Rund ein Drittel der APIs sind ungeschützt

Angriffe auf APIs und Webanwendungen sind zwischen Januar 2023 und Juni 2024 von knapp 14…

1 Woche ago

Universitätsmedizin Essen setzt für E-Mail-Sicherheit auf NoSpamProxy

Mit täglich über 45.000 eingehenden E-Mails ist die IT-Abteilung des Klinikums durch Anhänge und raffinierte…

1 Woche ago

Bau-Spezialist Schöck: Migration von SAP ECC ERP auf S/4HANA

Bau- und Fertigungsspezialist investiert in die S/4HANA-Migration und geht mit RISE WITH SAP in die…

2 Wochen ago

Pure Storage: Cloud, KI und Energieeffizienz

Trends 2025: Rasante Entwicklungen bei Automatisierung, KI und in vielen anderen Bereichen lassen Unternehmen nicht…

2 Wochen ago

GenKI verbessert Datenmanagement und Angebotsgenauigkeit

DHL Supply Chain nutzt generative KI-Anwendungen für Datenbereinigung und präzisere Beantwortung von Angebotsanforderungen (RFQ).

2 Wochen ago

Rolls-Royce Power Systems nutzt industrielle KI aus der IFS Cloud​

Marke mtu will globale Serviceabläufe optimieren und strategische Ziele hinsichtlich Effizienz, Nachhaltigkeit und Wachstum unterstützen.

2 Wochen ago