Enrique Cano

Enrique Cano

Programador web y documentalista, ... ok, y ¿qué es un documentalista?

Uso de cookies. Esta web utiliza cookies propias y de terceros para mejorar la experiencia de navegación mediante el análisis de los hábitos de navegación de los usuarios. Si continúa navegando, considero que acepta su uso. Entendido
En la página de cookies puede modificar su configuración e informarse con más detalle.

Congelar instantáneas web a demanda con Wayback Machine

Sucesión de capturas de la página de inicio de Google

Las primeras versiones de Google ya se incluyeron en el Internet Archive

El popular Internet Archive es una organización que captura páginas web periódicamente para preservar un gran historial de Internet; es fácil encontrar un dominio cualquiera en su buscador retrospectivo, la Wayback Machine. Pero, ¿sabías que le puedes pedir que capture una URL tal y como está ahora, sin esperar a sus robots?

¿Cuántas veces hemos visitado una página esperando encontrar un contenido determinado y resulta que ya no está? Los que conocemos este fantástico servicio nos sentimos con un as en la manga: una segunda oportunidad para recuperar el —a veces muy preciado— contenido perdido.

Otras veces, sin embargo, lo que tenemos en la pantalla sí es el contenido que nos interesa, pero lo que deseamos es preservarlo; asociar de forma indeleble la URL que vamos a añadir a marcadores, enlazar en nuestra web, o citar en un trabajo académico, con el contenido que presenta hoy.

Volatilidad de los contenidos

La tendencia de los contenidos a dejar de estar disponibles en la URL en la que estaban hace tiempo es un fenómeno de la Web y hay que tenerlo presente cuando utilizamos datos online.

En casa, para recursos interesantes que no vayamos a compartir con nadie, podemos utilizar el gestor bibliográfico Zotero, ya que nos da la opción de «guardar una instantánea», es decir, una copia de una web tal como está en el momento de almacenarla en el gestor. Si la página cambia, siempre podremos recurrir a la versión guardada con el material que nos resultaba interesante.

En lo académico, en cambio, donde sí es necesario compartir o mencionar los recursos utilizados para un trabajo, no resulta muy operativo adjuntar toda una serie de copias de las páginas web relevantes (y puede que ni siquiera tengas permiso para hacerlo), de forma que se recurre a las referencias bibliográficas.

Para limitar la responsabilidad del que cita ante la volatilidad de los contenidos, se añade, a las ya de por sí saturadas referencias, la fecha de consulta, que parece decir «¡ah! cuando yo miré, éso es lo que decía». Esta fecha, por otro lado, resulta inútil si el contenido cambia sin que recursos como el Internet Archive, o la caché de Google, lo hayan registrado a tiempo, o aún lo conserven en sus memorias, respectivamente.

También en otros campos, como el derecho, puede ser extremadamente útil demostrar dentro de un tiempo que tal página contiene, ahora, determinada información.

Servicios automáticos de terceros para captura de webs

Que sean «de terceros» y automáticos tiene sus ventajas: por un lado, las capturas son incorruptibles, puesto que un tercero no tiene interés alguno en alterar el contenido de la captura; por otro, también son duraderas, al menos, más duraderas que nuestros discos duros (¿quién usa todavía discos de 1996?).

Internet Archive

El Internet Archive ofrece la opción «Save Page Now», que captura una página, tal como aparece ahora, para usarla como referencia fiable en el futuro. La página se incorpora entonces al cuerpo de capturas de la Wayback Machine, y desde ese momento es recuperable la versión actual mediante la URL facilitada. El uso de Internet Archive es gratuito para uso académico y de investigación.

Internet Archive is a non-profit library of millions of free books, movies, software, music, and moreEl Internet Archive es una biblioteca de millones de libros gratuitos, películas, software, música y más, sin ánimo de lucro

SafeCreative

SafeStamper. Certificación digital eficaz y sin complicacionesEl servicio SafeStamper se orienta a la prueba con validez legalEn España, la zaragozana SafeCreative, SL, —de cuyo servicio de registro de obras intelectuales soy usuario actualmente— ofrece entre sus servicios el «PageStamper», un método de certificación digital que emite un PDF firmado que certifica el contenido de una página web en un momento determinado, e incluye una URL donde se puede verificar. El servicio es de pago tras un margen de prueba.

Limitaciones

La primera gran limitación es que ambos servicios sólo capturan páginas accesibles pública y anónimamente, es decir, ni intranets, ni chats, ni nada donde no se pueda acceder «a pelo».

El Internet Archive respeta las exclusiones, de modo que si el propietario de una página les indica que no quiere que aparezca, no aparece. Además, eliminan de oficio los contenidos inapropiados, lo cual podría ser contraproducente si la intención de la captura es, precisamente, respaldar que se están ofreciendo esos contenidos.

Respecto al valor probatorio, que cada uno interprete lo que considere. Desde mi humilde punto de vista, considero que una captura del Internet Archive es suficiente para demostrar el contenido de tal página en determinado momento.

De otro lado, desde que las páginas pueden ser dinámicas y presentar contenidos diferentes según desde dónde se acceda, podría darse el caso de que las capturas de una misma página (sin que ésta haya cambiado) realizada desde España y desde fuera, sean diferentes.

Los usos de ambas herramientas están bastante definidos: el Internet Archive tiene un propósito de conservación a largo plazo para investigación y usos académicos y PageStamper se enmarca en un paquete de servicios relacionados con la autoría de obras intelectuales.