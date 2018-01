Nova web da asociación © Asociación PuntoGal Para a recolleita, a BNE emprega NAS, unha ferramenta de código aberto

Nos últimos días do ano 2017, a Biblioteca Nacional de España levou a cabo, por encargo da Biblioteca de Galicia, a primeira recolección do dominio .gal, o que supuxo a descarga de máis de 140 GB de información. A operación realizouse sobre a lista de 4.261 dominios fornecidos pola Asociación PuntoGal. Ao redor da metade non teñen contido, a maioría por ser só dominios reservados. Da outra metade, un 26% colleitouse na súa totalidade, mentres que o resto acadou o límite de tamaño de 150 MB por dominio, o mesmo que se estableceu para a última recolección masiva do dominio .es.

O Arquivo da Web é a colección formada porlos sitios web (incluídos blogs, foros, documentos, imaxes, vídeos, etc.) que se recolectan co obxectivo de preservar o patrimonio documental en Internet e asegurar o acceso ao mesmo. O Real Decreto 635/2015 regula o depósito legal das publicacións en liña. De acordo con el, os centros de conservación das comunidades autónomas e a Biblioteca Nacional de España colaboran para a construción e xestión dun depósito legal colaborativo.

Esta primeira recolección masiva do dominio .gal pasa a formar parte da colección web de Galicia e do seu depósito legal electrónico, cuxa xestión é responsabilidade da Biblioteca de Galicia. Dende xullo de 2017 estes contidos están accesibles a través de terminais seguros nos centros de conservación das comunidades autónomas que o solicitaron, a propia Biblioteca de Galicia entre eles, e na Biblioteca Nacional de España.

Para arquivar a web utilízase NAS (NetarchiveSuite), unha ferramenta de código aberto deseñada pola Biblioteca de Dinamarca. Para rastrexar incorpora o robot Heritrix, creado por Internet Arquive, primeira organización que empezou a rastrexar e arquivar a web en 1996. As recoleccións buscan reproducir con detalle o aspecto do sitio e as funcionalidades do mesmo dispoñibles durante a captura, de tal forma que a réplica do sitio web sexa tan navegable como a súa versión viva. Unha vez completado o rastrexo, as webs arquivadas son visualizadas na OpenWayback, unha aplicación que lle ofrece ao usuario a posibilidade de seleccionar que versión concreta dunha web determinada desexa consultar.