Danas vas ukratko želim informirati o posebnom tipu web alata za koji sam osobno doznao tek nedavno i od tad mi se već u nekoliko navrata pokazao vrlo korisnim pri njuškanju za starim i teško dostupnim podacima na internetu.
Što su web arhive?
Radi se o takozvanim “internetskim arhivima”. To su zapravo stranice i/li aplikacije koje pohranjuju velike količine različitih online sadržaja, i to na način da u vremenskim intervalima bilježe i pohranjuju sve podatke dostupne na nekoj internetskoj adresi.
Tako pomoću web arhiva možete proučiti sadržaj već odavno mrtvih web adresa, ponovno pronaći važnu informaciju koju je netko namjerno pokušao obrisati, ili pak vidjeti koje su se vijesti vrtjele na vašem omiljenom portalu prije nekoliko godina.
Danas, dakako, postoji već popriličan broj obimnih internetskih arhiva i nema smisla da vam pokušavam dati njihov pregled, već to ostavljam vama za istraživanje. Ono što zapravo želim jest ovim vas tekstom naviknuti na ideju da internet “pamti” i mnoge stvari za koje mislimo da su već odavno nepovratno izgubljene. U tu svrhu upoznat ću vas s tek dvije internetske arhive, jednom domaćom i jednom stranom, kojima se osobno koristim.
Počnimo od strane web arhive koju preporučujem pri potrazi za arhiviranim verzijama stranica iz svijeta. Ova se arhiva zove The Wayback Machine (u slobodnom prijevodu, “Stroj za put unatrag kroz vrijeme”), a dostupna je u sklopu web stranice Internet Archive.
Stranica Internet Archive
Ova stranica zamišljena je kao digitalna knjižnica koja će velikom broju ljudi omogućiti besplatan pristup ogromnoj količini podataka. No, dakako da ovo sa sobom povlači i neke nejasnoće po pitanju prekoračenja autorskih prava. Tako je Internet Archive, koji u svojoj bazi podataka navodno ima 20 milijuna digitaliziranih knjiga, te milijune prikupljenih audio i video snimki, fotografija i primjeraka softvera, već u više navrata bio predmetom kontroverzi i optužbi za internetsko piratstvo. Stoga, ako namjeravate posjetiti ovu stranicu, budite sigurni da s nje ne skidate sadržaj zaštićen autorskim pravima.
No, ono što nas u sklopu današnje teme zanima jest isključivo dio stranice Internet Archive poznat kao The Wayback Machine, koji je njihova digitalna arhiva starog internetskih sadržaja.
The Wayback Machine
Kako The Wayback Machine funkcionira? Tako što periodično bilježi trenutno stanje i dostupne podatke na milijardama web stranica diljem svijeta. Na taj način radi se internetska arhiva starih verzija raznih internetskih adresa, pa je pomoću ovog alata moguće pronaći podatke koji već neko vrijeme nisu dostupni, bilo zbog starosti ili brisanja određenih sadržaja s web stranica.
The Wayback Machine postoji u dvije verzije: kao besplatna online tražilica arhiviranih internetskih sadržaja, i kao dodatak za Google Chrome koji služi istoj funkciji. U sklopu ovog projekta se sadržaji s raznih web stranica vrijedno arhiviraju već posljednjih 20 godina, zbog čega arhiva The Wayback Machine sadrži već oko 349 milijardi za budućnost sačuvanih web sadržaja!
Ovaj je alat iznimno lako koristiti. Sve što trebate napraviti jest posjetiti adresu archive.org/web/ (LINK) i u traku nalik klasičnoj tražilici upisati ime stranice čije arhivirane sadržaje želite pronaći, ili pak kopirati u tražilicu cijeli link čije prethodne verzije tražite. Nakon toga, The Wayback Machine će provjeriti ima li traženu adresu u svojoj arhivi. Ako ima, tada će vam na ekranu prikazati kalendar sa zacrnjenim datumima. Crni datumi znače da je u arhivi dostupna verzija stranice koja je pohranjena na taj dan, pa trebate samo kliknuti na željeni datum kako biste pristupili nekoj od arhiviranih prošlih verzija stranice.
Nije garantirano da će The Wayback Machine imati arhivirane upravo sve stranice koje tražite, ili da je arhiviranje bilo obavljeno na dan u koji vam se potrebno “vratiti”. Zato ova stranica predviđa i opciju da sami izvršite pohranu stanja web lokacija za koje mislite da će vam zatrebati u budućnosti.
Po čemu se ovo razlikuje od običnog dodavanja stranice pod “favorite” u vašem web pregledniku? Pa, ako administrator ili treća strana odluči ugasiti stranicu koju čuvate u favoritima ili pak s nje izbrisati određene sadržaje, link u vašoj arhivi favorita odvest će vas na stranicu kakva ona trenutno jest – nedostupna ili izmijenjena. No, ako stranicu arhivirate pomoću ovog alata, uvijek ćete moći pogledati njezinu verziju iz dana kad je ona arhivirana pomoću web arhive.
Hrvatski arhiv weba
Naravno, velike stranice poput The Wayback Machine-a, koliko god sveobuhvatne pokušavaju biti, rijetko kad gube vrijeme i digitalni prostor da bi arhivirale “male i nevažne” stranice iz neke male državice, pisane na jeziku s malim brojem govornika. Stoga vam je za pregledavanje arhive domaćeg weba puno bolja opcija neka od domaćih web arhiva koja se specijalizirala upravo za pohranjivanje podataka s hrvatskog weba.
Po mome mišljenju, najobuhvatnija i najbolja domaća web arhiva jest besplatni Hrvatski arhiv weba (HAW) koji je pokrenut pod okriljem Nacionalne i sveučilišne knjižnice u Zagrebu. Na samoj stranici navodi se kako je cilj ovog projekta “preuzimanje i trajno čuvanje publikacija s interneta kao dijela hrvatske kulturne baštine.” Svakako zanimljiv i dalekovidan koncept, pogotovo kad shvatimo koliko je današnja kultura nerazdvojivo povezana s webom.
Nacionalna i sveučilišna knjižnica u Zagrebu započela je s projektom katalogizacije web stranica još 1998, a konkretno arhivirati sadržaje s neta započeli su 2004. godine. Tad se ovaj projekt još zvao Digitalni arhiv mrežnih publikacija, a 2010. mu se ime mijenja u sadašnji Hrvatski arhiv weba.
Do sad je Hrvatski arhiv weba uspio s interneta prikupiti blizu 55.5 tisuća arhiviranih sadržaja s više od 6.5 tisuća domaćih web stranica.
Hrvatski arhiv weba koristi se lako kao i gore spomenuti The Wayback Machine. Samo posjetite njegovu početnu stranicu na adresi haw.nsk.hr/ (LINK), zatim u tražilicu unesite naziv željene stranice ili cijeli link adrese do čijih starih sačuvanih adresa želite doći. Dobit ćete vertikalnu listu očuvanih verzija tražene stranice, a uz svaku će biti istaknut datum na koji je ona arhivirana.
Zaključak
Možda se današnja tema nekome, ako su mu internetske arhive već poznate, čini kao otkrivanje tople vode. No, u duhu ovakvih projekata kojima je glavni cilj slobodno dijeljenje informacija na internetu, smatram kako vrijedi jasno izložiti osnovne informacije o ovim internetskim alatima kako bi što veći broj ljudi u budućnosti znao da im oni stoje na raspolaganju.
***