Résumer: Cela fait plus de 26 ans que Internet Archive s’est mis à préserver toutes sortes de documents numériques, notamment des logiciels, des jeux, des films, des images et, bien sûr, des pages Web. La Wayback Machine est le mécanisme qui gère la tâche sans cesse croissante de collecter et de rassembler des instantanés d’Internet et il a parcouru un long chemin depuis le milieu des années 90.
Considérez la Wayback Machine comme une machine à remonter le temps virtuelle. Avec lui, vous pouvez voyager dans le passé et voir à quoi ressemblaient les sites Web à intervalles réguliers tout au long de l’histoire. Cela peut être extrêmement utile lors de la recherche ou de la vérification des faits et tout aussi amusant lors de la chronique de l’évolution de la conception Web au fil des ans.
La Wayback Machine avait réussi à archiver deux téraoctets de données après seulement un an, ce qui représentait une énorme quantité de données à l’époque. De nos jours, vous pouvez stocker tout cela sur une clé USB à 30 $ et la transporter dans votre poche.
Aujourd’hui, la Wayback Machine contient plus de 700 milliards de pages Web dans sa base de données et approche les 100 pétaoctets. Malheureusement, le travail de l’organisation à but non lucratif ne devient pas plus facile car les paywalls et autres jardins clos comme Facebook le rendent de plus en plus difficile à capturer. Aurons-nous un dossier bien conservé de l’activité actuelle des médias sociaux dans 20 ans ?
Lecture connexe : Internet Archive a amélioré ses scans de Computerworld
Si le métaverse se matérialise comme certains le prédisent, Internet Archive devra faire évoluer ses efforts de collecte en conséquence ou risquer de ne pas cataloguer ce qui se passe sur ce support numérique.
Tout le monde ne croit pas que l’organisation a le droit de faire certaines des choses qu’elle fait. Lorsque Internet Archive a lancé la Bibliothèque nationale d’urgence sans listes d’attente au début de la pandémie, plusieurs éditeurs ont déclaré que cela équivalait à une violation massive délibérée du droit d’auteur.
Internet Archive a fermé sa bibliothèque de prêt d’urgence tôt dans l’espoir d’éviter une poursuite coûteuse, mais les éditeurs ont quand même intenté une action en justice. En juillet, les deux parties ont déposé une requête en jugement sommaire.