Canto ocupan os .gal? 140 xigas, cando menos

Para a recolleita, a BNE emprega NAS, unha ferramenta de código aberto Dominio Público Praza Pública

Nos últimos días do ano 2017, a Biblioteca Nacional de España levou a cabo, por encargo da Biblioteca de Galicia, a primeira recolección do dominio .gal, o que supuxo a descarga de máis de 140 GB de información. A operación realizouse sobre a lista de 4.261 dominios fornecidos pola Asociación PuntoGal. Ao redor da metade non teñen contido, a maioría por ser só dominios reservados. Da outra metade, un 26% colleitouse na súa totalidade, mentres que o resto acadou o límite de tamaño de 150 MB por dominio, o mesmo que se estableceu para a última recolección masiva do dominio .es

O Arquivo da Web é a colección formada porlos sitios web (incluídos blogs, foros, documentos, imaxes, vídeos, etc.) que se recolectan co obxectivo de preservar o patrimonio documental en Internet e asegurar o acceso ao mesmo. O Real Decreto 635/2015 regula o depósito legal das publicacións en liña. De acordo con el, os centros de conservación das comunidades autónomas e a Biblioteca Nacional de España colaboran para a construción e xestión dun depósito legal colaborativo.

Esta primeira recolección masiva do dominio .gal pasa a formar parte da colección web de Galicia e do seu depósito legal electrónico, cuxa xestión é responsabilidade da Biblioteca de Galicia. Dende xullo de 2017 estes contidos están accesibles a través de terminais seguros nos centros de conservación das comunidades autónomas que o solicitaron, a propia Biblioteca de Galicia entre eles, e na Biblioteca Nacional de España.

A primera recolección do dominio galego obtivo os datos contidos en 4.261 direccións, a metade activas

Para arquivar a web utilízase NAS (NetarchiveSuite), unha ferramenta de código aberto deseñada pola Biblioteca de Dinamarca. Para rastrexar incorpora o robot Heritrix, creado por Internet Arquive, primeira organización que empezou a rastrexar e arquivar a web en 1996. As recoleccións buscan reproducir con detalle o aspecto do sitio e as funcionalidades do mesmo dispoñibles durante a captura, de tal forma que a réplica do sitio web sexa tan navegable como a súa versión viva. Unha vez completado o rastrexo, as webs arquivadas son visualizadas na OpenWayback, unha aplicación que lle ofrece ao usuario a posibilidade de seleccionar que versión concreta dunha web determinada desexa consultar.

 

Para a recolleita, a BNE emprega NAS, unha ferramenta de código aberto Dominio Público Praza Pública
Nova web da asociación © Asociación PuntoGal

Grazas ás socias e socios editamos un xornal plural

As socias e socios de Praza.gal son esenciais para editarmos cada día un xornal plural. Dende moi pouco a túa achega económica pode axudarnos a soster e ampliar a nosa redacción e, así, a contarmos máis, mellor e sen cancelas.