WEB-ul este descentralizat si fluid prin conceptie, dar tot acest haos si efemeritate poate face dificila mentinerea unui site online fara intreruperi. Acesta este motivul pentru care functia Wayback Machine a Internet Archive a devenit atat de valoroasa de-a lungul anilor, mentinand un istoric al paginilor uitate de mult timp. Acum, memoria sa profunda va contribui la asigurarea faptului ca site-urile pe care le vizitati nu vor cadea niciodata, prin intermediul unui parteneriat cu compania de infrastructura de internet Cloudflare.
Din 2010, Cloudflare ofera o functie numita Always On, care pune in cache o versiune statica a site-urilor pe care o poate servi vizitatorilor in caz de indisponibilitate. Always On a fost una dintre ofertele initiale ale Cloudflare; John Graham-Cumming, directorul de tehnologie al companiei, spune ca infrastructura care o alimenteaza urma sa fie reamenajata. Gandindu-se cum sa o modernizeze, echipa a avut o idee: De ce sa nu folosim Wayback Machine, gigantul existent de crawling si caching, pentru a alimenta Always On? Arhiva Internet oferea deja o interfata de programare a aplicatiilor care ar fi facilitat Cloudflare sa extraga ceea ce avea nevoie.
„Am lucrat cu ei pentru a ne asigura ca sunt de acord sa o folosim in acest mod”, spune Graham-Cumming. „Este unul dintre acele lucruri in care este ca si cum, da, acest lucru functioneaza pentru toata lumea, asa ca hai sa o facem. Daca ajungeti pe un site web care foloseste Cloudflare si acesta este offline, vom afisa cea mai recenta versiune care se afla in arhiva Wayback Machine.”
Internet Archive spune ca a salutat oportunitatea de a colabora cu Cloudflare pentru Always On. Iar organizatia si-a extins recent atentia asupra fiabilitatii site-urilor web si a integritatii tehnice pe intregul web. in februarie, a anuntat un proiect cu browserul Brave pentru a oferi o memorie cache recenta a unui site web in cazul in care utilizatorii se lovesc de o eroare 404. Unele extensii de browser au oferit aceasta functionalitate de-a lungul anilor, dar Internet Archive spune ca integrarea completa a acesteia intr-un browser si oferirea ei prin intermediul Always On reprezinta un pas pozitiv.
Parteneriatul cu Cloudflare va permite, de asemenea, ca Wayback Machine sa gaseasca si mai multe site-uri web pentru a le cerceta, ceea ce reprezinta un avantaj pentru Internet Archive. Timp de peste doua decenii, Wayback Machine a arhivat cat de mult poate din web-ul public, adaugand peste un miliard de URL-uri pe zi la corpus. in total, arhiva contine peste 468 de miliarde de pagini web si peste 45 de petabyte de date. Dar, chiar si cu toate semnalele, listele si sursele pe care Wayback Machine le foloseste pentru a parcurge o multime de site-uri, Internet Archive cauta mereu modalitati de a gasi site-uri care i-au scapat. Always On ofera una dintre acestea, datorita bazei largi si indepartate de clienti a Cloudflare.
Cloudflare deserveste mai mult de 25 de milioane de site-uri, iar operatorii de domenii vor trebui sa opteze pentru a utiliza Always On cu Wayback Machine. Serviciul a fost intotdeauna gratuit pentru utilizatorii Cloudflare si va continua sa fie. Dar fondatorul Internet Archive, Brewster Kahle, si directorul Wayback Machine, Mark Graham, spun ca infrastructura lor va putea face fata interogarilor si extragerilor de date suplimentare de la Always On.
„Am dori doar sa facem web-ul mai fiabil”, spune Kahle. „Ne dorim o infrastructura robusta acolo si putem face parte din ea, dar nu suntem totul. Vrem ca mai multi participanti sa lucreze impreuna in toate modurile diferite. Noi nu am fi o retea de distributie a continutului foarte buna si poate ca Cloudflare nu ar fi neaparat cea mai buna arhiva a web-ului.”
Kahle spune ca parteneriatul cu Cloudflare a fost foarte constructiv in testele timpurii si ar dori sa vada mai multe colaborari care sa depaseasca ceea ce el numeste „granita .com, .org”.
Graham de la The Wayback Machine subliniaza, totusi, ca, in cele din urma, orice colaborare sau proiect trebuie sa serveasca misiunii principale a Internet Archive. „Suntem mereu in cautare de noi modalitati prin care putem face o treaba mai buna pentru a arhiva o mai mare parte a web-ului public”, spune el. „Aceasta este o alta sursa de resurse web pe care trebuie sa o conservam si sa o punem la dispozitie – speram ca pentru totdeauna, cu siguranta pentru toata viata noastra. Atata timp cat suntem aici, vom continua sa mentinem acest lucru.”
Probabil genul de dedicatie rara pe care o doriti ca polita de asigurare pentru site-ul dumneavoastra.
Articol preluat de pe https://www.wired.com/story/cloudflare-internet-archive-wayback-machine/