Zoetrope indexe l'éphémère en ligne

Par 18 novembre 2008

Ce moteur permet de retrouver des informations autrefois en ligne et depuis disparues. Une interface intuitive facilite la recherche de ces données historiques.

Une équipe de chercheurs de l'Université de Washington a travaillé de concert avec Adobe Systems à l'élaboration d'un système d'archivage du contenu Web intitulé Zoetrope. Connaître le temps qu'il faisait dans telle ville et son trafic routier tel jour et à telle heure sont en effet autant d'informations qu'il est difficile sinon impossible de retrouver avec les moteurs de recherche traditionnels. Ces derniers ne représentant que l'état du Web à un instant donné, un grand nombre de données ayant auparavant été disponibles en ligne sont à jamais disparues. Doublé d'un moteur à l'interface soignée, Zoetrope se veut à la fois plus exhaustif et facile d'utilisation que les autres solutions existantes. "La bases de données d'Internet Archive, par exemple, souffre de trop nombreux manques. Elle est en outre difficilement accessible à l'internaute non professionnel", souligne Dan Weld, un professeur en science informatique à l'UW. La recherche sur le nouveau moteur se fait simplement par mots clés.
Objectifs : exhaustivité & simplicité
Il est ainsi possible de consulter les versions antérieures de sites Web, dont les liens apparaissent du plus récent au plus ancien. Des filtres par date ou d'autres critères permettent d'affiner la recherche, selon qu'on souhaite par exemple consulter tous les articles parus sur cnn.com relatifs à des vedettes de cinéma ou encore tous ceux qui sont parus un vendredi. Des informations extrêmement diverses sont déjà disponibles sur le site. Une personne peut par exemple trouver rapidement si le trafic à tel carrefour dans une ville donnée était fluide ou encombré pendant les jours de pluie à une heure précise. Auparavant, l'internaute aurait dû éplucher des fichiers PDF consultables sur le site du Département d'État des transports aux USA. Autre usage possible : les fans de sport peuvent consulter l'historique des résultats d'un joueur ou d'une équipe en quelques clics.
Enregistrement automatique des mises à jour
"Zoetrope n'est pas réservée à une communauté particulière mais pourrait s'adresser à n'importe qui se posant une question". Outre la simple recherche par mots-clés, le moteur permet de croiser des informations issues de diverses sources. Dan Weld a ainsi pu vérifier si les variations quotidiennes du taux de pollution aux Jeux Olympiques de Pékin avaient eu une incidence sur le nombre de records du monde battus chaque jour. Zoetrope n'est encore qu'un prototype. Il n'existe que depuis quatre mois depuis lesquels environ mille sites sont archivés, si bien que les recherches ne vont pas encore au-delà. Ses concepteurs espèrent y incorporer les autres archives Internet existant depuis quatorze ans. Ils réfléchissent enfin à l'élaboration de méthodes d'archivage automatique qui permettraient d'enregistrer automatiquement les mises à jours des sites surveillés. En attendant, l'outil sera disponible dès l'été prochain.

Mentions légales © L’Atelier BNP Paribas