Das Team der Forscher an der UW kann bereits auf erste Ergebnisse verweisen. “Zoetrope lässt Anwender dabei Informationen tatsächlich im Kontext einer Webseite suchen”, betonte UW-Computerwissenschaftler Eytan Adar. Die Entwicklung setzt dazu auf regelmäßige Schnappschüsse des Zustands von Webseiten als Datenquelle. Sie soll sich aber deutlich von bisherigen Angeboten zur Nachforschung im historischen Web wie der Wayback Machine des Internet Archive abheben.

Im modernen Web sehen Nutzer nur den aktuellen Ist-Zustand von Webseiten, in dem mit verschiedensten Werkzeugen Daten gesucht, manipuliert und visualisiert werden können. “Da ist es schon irgendwie überraschend, dass es keine vergleichbaren Möglichkeiten für das vergängliche Web gibt”, so Dan Weld, Professor für Computerwissenschaften an der UW. Das wollen die Forscher mit Zoetrope ändern und dabei auch deutlich über einfache Stichwortsuchen hinaus gehen. “Bei Zoetrope kann der Nutzer ‘Linsen’ auf Bereiche der Webseite zeichnen, um dadurch Fragen zu historischen Inhalten zu stellen”, erklärte Adar. Wer sich etwa für Verkehrsentwicklung interessiert, könne leicht alte Versionen einer entsprechenden Webseite ansehen und die Daten auch visualisieren. Auch ein Quervergleich verschiedener Webseiten ist mit Zoetrope möglich, beispielsweise von Öl- und Benzinpreisen mit entsprechenden Nachrichtenmeldungen.

Die Forscher hoffen, Zoetrope bereits im kommenden Sommer frei verfügbar machen zu können. Die historische Web-Suche soll möglichst als Browser-Plug-in oder Software-as-a-Service angeboten werden. “Das ideale Anwendungsszenario wäre, dass Anwender ganz normal im Web surfen und bei Bedarf Fragen zu historischen Informationen stellen können, ohne den Browser zu verlassen”, erklärt Adar auf Nachfrage von pressetext. Vorstellbar ist den Forschern zufolge beispielsweise ein Schieberegler, mit dem Nutzer einfach immer weiter in die Vergangenheit einer Webseite spähen können. Derzeit speichert Zoetrope stündlich Schnappschüsse von rund 1000 verschiedenen Webseiten. Adar will eruieren, wie das Programm auf das gesamte Web ausgeweitet werden kann und arbeitet auch daran festzustellen, wie regelmäßig verschiedene Seiten gespeichert werden müssen. Langfristig könnte Zoetrope das aufgrund der Aktualisierungsfrequenz von Webseiten automatisch bestimmen.

Eine Einschränkung von Zoetrope ist, dass erst seit rund vier Monaten Daten gesammelt werden. “Wir würden sehr gerne Zoetrope mit den Daten der Wayback Machine integrieren”, meint Adar daher zu pressetext. Es müssten aber wohl diverse Copyright-Fragen geklärt werden, um diesen Datenschatz nutzen zu können. Das Internet Archive sammelt bereits seit 1996 historische Webdaten und hat Schnappschüsse von 85 Milliarden Webseiten, die im heutigen Web teils gar nicht mehr existieren. Ein wirklich effizientes Werkzeug zum Durchforsten und Auswerten dieser Datensammlung ist die Wayback Machine allerdings nicht, da sie lediglich den Aufruf einzelner Schnappschüsse einer bekannten URL erlaubt.

Silicon-Redaktion

Recent Posts

Alle Prozesse im Blick: IT-Service Management bei der Haspa

Wo es früher auf Buchhalter, Schreiber und Boten ankam, geht es heute vor allem um…

14 Stunden ago

Wie generative KI das Geschäft rund um den Black Friday verändert

Mit KI-Technologien lässt sich das Einkaufserlebnis personalisieren und der Service optimieren, sagt Gastautor Gabriel Frasconi…

15 Stunden ago

Banken und Versicherer sind KI-Großabnehmer

Ein Großteil der weltweiten KI-Gelder fließt in den Finanzsektor. 2023 wurden in der Branche 87…

1 Tag ago

Siemens legt 10 Milliarden Dollar für Software-Spezialisten auf den Tisch

Die Übernahme des US-amerikanischen Anbieters Altair Engineering soll die Position im Markt für Computational Science…

2 Tagen ago

Standortübergreifender KI-Einsatz im OP-Saal

Ein deutsch-französisches Projekt hat hybride Operationssäle entwickelt, die durch 5G-Netz und KI neue Anwendungen ermöglichen.

2 Tagen ago

OT-Security braucht zunächst Asset-Transparenz

Unternehmen wissen oft nicht, welche Geräte in der Produktion eine IP-Adresse haben, warnt Peter Machat…

5 Tagen ago