• Završeno deseto pobiranje hrvatske nacionalne internetske domene

    10. 2. 2021.

    Nacionalna i sveučilišna knjižnica u Zagrebu u suradnji sa Sveučilišnim računskim centrom Sveučilišta u Zagrebu (Srce) od 22. prosinca 2020. do 7. siječnja 2021. godine provela je deseto pobiranje (harvestiranje) hrvatske nacionalne internetske domene. Prikupljeni su i pohranjeni javno dostupni sadržaji svih mrežnih sjedišta na vršnoj .hr domeni, uključujući from.hr i com.hr.

    Uspješno je obrađeno 180 379 532 upita i pobiranjem preuzeto 19 TB sadržaja spremljenoga u format WARC. Datoteke u ovome formatu komprimirane su te zauzimaju 11 TB diskovnoga prostora.

    Korišten je popis aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici u Zagrebu dostavila služba Hrvatske akademske i istraživačke mreže (CARNET) za upravljanje nacionalnom domenom Republike Hrvatske, a pobiranje je provedeno pomoću alata otvorenoga koda Heritrix. Robot koji je provodio pobiranje dolazi s IP adrese 61.53.3.11 i predstavljao se kao Mozilla/5.0 (compatible; heritrix/3.4.x; + https://haw.nsk.hr/cesta-pitanja/).

    Sadržaji prikupljeni desetim pobiranjem hrvatske nacionalne internetske domene su dostupni na stranicama Hrvatskoga arhiva weba, na kojima se mogu pregledavati i sadržaji pohranjeni u prethodnih devet pobiranja, tematske zbirke, kao i sadržaji prikupljeni selektivnim pobiranjima.

Povratak na popis novosti