Lo efímero del hipervínculo II: Memento Time Travel y más archivos web actuales

La primera parte está aquí: Lo efímero del hipervínculo I.

Página de búsqueda y reconstrucción, con sus controles de tiempo en Memento Time Travel.

Nombre: Memento Time Travel (timetravel.mementoweb.org/) / Buscador de mementos de UK Web Archive. Son buscadores de "mementos", es decir una copia archivada de un recurso web.

Fecha de lanzamiento: Protocolo Memento: 2009. Time Travel: 2015 (?).

Descripción: Es un protocolo surgido de la colaboración de Los Alamos National Laboratory y la Old Dominion University. Ha cristalizado varios servicios que sirven para buscar e incluso, para reconstruir una página con orígenes en diferentes archivos.

En WM no es difícil encontrar elementos (CSS, imágenes) en una misma página que pertenecen a distintos períodos. Páginas que han sido archivadas con publicidad sobre la campaña presidencial de 2012 de Estados Unidos en artículos periodísticos que narran noticias contemporáneas a la carrera presidencial de 2008 en Estados Unidos. Fueron archivadas en el mismo año en el que aparecía dicha publicidad.

Lo mismo ocurre cuando se comparan varios archivos diferente o incluso representaciones diferentes de la misma página web realizadas mediante arañas con User Agent diferentes. Es decir, las representaciones de una misma página web varían incluso dentro del mismo archivo pero difieren notablemente entre diferentes archivos (si es que existen versiones en todos o permanecen en el tiempo).

Es por eso por lo que tener a mano un lugar (o varios, puesto que el UK Web Archive también incorpora el suyo) que hagan uso de este protocolo.

Vista gráfica de como se muestran los diferentes "mementos" de meneame.net en el buscador de UK Web Archive.

Mientras que la búsqueda de Mementos de UK Web Archive dispone de una representación gráfica de los diversos archivos, Memento Time Travel también permite buscar e incluso reconstruir la apariencia de un sitio web en una fecha determinada. Esta versión reconstruida se podría a su vez archivar, si fuese necesario.

Desventajas: La reconstrucción no es perfecta y la búsqueda no llega hasta los archivos que no han implementado el protocolo Memento.

Ventajas: Dispone de "botones de acción de favoritos" [A] y de una extensión / mink (para Chrome) que permiten navegar aún más naturalmente que con Webrecorder.io y conocer si dicha página está archivada. Están en desarrollo más soluciones, algunas enfocadas al ámbito de servidores (archivado "server-side").

Velocidad:La velocidad de reconstrucción es algo lenta.

Confiabilidad: Es un protocolo, no un sitio web de archivado. Si los servidores de Memento Time Travel se vieran inutilizados mañana, la tecnología seguiría existiendo.

Nombre: Freezepage (freezepage.com).

Fecha de lanzamiento: 2003.

Descripción: Archivador exclusivamente bajo demanda creado por iniciativa privada. Es similar en concepto a Archive.is (elimina los scripts); pero en cuanto a la disponibilidad de los archivos a terceros es más similar a cualquier gestor de marcadores

Cuentas: Hay varios escalones: "Usuario no registrado". Dicho usuario puede empezar a guardar páginas al instante, pero sus adquisiciones se borrarán pasados 3 días si no se registra. Se disponen de 10 MB en este modo. Los archivos de un"Usuario registrado" registrado no se borran pero dispone de 20 MB, aunque tienen que loguearse una vez al mes para conservar los archivos. Los usuarios de pago pueden utilizar 50 MB, 200 MB o 500 MB con pagos trimestrales, semestrales o anuales, respectivamente y precios crecientes.

Velocidad de guardado / navegación: La velocidad de guardado no es muy alta. El esquema de la URL de guardado es: freezepage.com/?button=1&url=[URI]&name=[titulo].

Limitaciones / desventajas / problemas: No se redirecciona de HTTP a HTTPS a la hora de loguearse. Cuando se comparte el enlace tiene una botonera de Facebook, Twitter, MySpace (!), delicious (!), stumbleupon (!), digg, favoritos de yahoo (!), One Drive (aunque llamado live bookmarks) y Google Bookmarks. Sin embargo, hay un error en el código que hace que la URL a compartir sea "freezepage.com/default". La URL es visible perfectamente en la barra de direcciones por lo que además de ser servicios de favoritos descontinuados en su mayoría, son totalmente inútiles. Si la acción de compartir se produce no desde el archivo mismo sino desde una carpeta y pinchando en "Share", entonces sí muestra la URL para compartir.

No se pueden buscar páginas que ya hayan sido archivadas sin usar métodos externos (Google), lo cual a mí me parece una desventaja, pero también se puede de ver como un archivador privado.

No sigue el protocolo Memento. Las URLs son todas alfanuméricas (no dispone ninguna otra versión—aunque siempre se puede agregar ?url=[URI] con la URL original—) y son bastante largas. La dirección no tiene marca de tiempo.

La interfaz para compartir carpetas, mover los archivos entre ellas es bastante confusa. No se pueden adquirir (ellos lo llaman "congelar") dos páginas a la vez y a veces se queda en estado de espera aunque no esté guardando nada. Falla bastante.

No dispone de extensión ni de manera de automatizar el proceso.

Ventajas: Dispone de un buscador de tus adquisiciones (algo así se echa en falta en el resto de archivadores analizados). Las propiedades de una adquisición están desgranadas y tienen muchos datos (al igual que cuando se guarda se muestra el número de elementos guardados): tiene un visor del código fuente de la página adquirida, velocidad del archivado, información técnica con las peticiones, los elementos embebidos, los encabezados HTTP. Aunque, bien es cierto, todos estos datos tienen una importancia muy relativa. También marca de manera clara cuando un archivo falla por algún motivo. Dispone de "botón de acción de favoritos".

Una vez un usuario registrado ha confirmado su correo puede compartir carpetas.

Se puede seleccionar si se quiere guardar una versión con todos los elementos (aunque siempre se eliminan los scripts), todos sin los scrips, o sólo texto.

Dispone de una guía, pequeña, pero curiosa.

Confiabilidad: Según ellos mismos desde 2003 no han sufrido ninguna pérdida de datos, aunque en sus términos de uso remarcan que no dan ninguna garantía. No he logrado averiguar mucho de esta empresa.

FreezePage hace razonablemente bien su trabajo de archivador personal en páginas poco complejas pero hay alternativas mucho mejores y con tecnología más actual.

Otros datos: FreezePage hace razonablemente bien su trabajo con páginas poco complejas pero yo sólo la recomendaría como un servicio de archivado temporal o como "pasarela" con otros servicios de archivado, puesto que hay alternativas mucho mejores y con tecnología más actual.

Nombre: Megalodon.jp / gyo.tc es un archivo centrado en el mercado japonés.

Fecha de lanzamiento: 2006.

Descripción: Servicio de archivado bajo demanda que obedece criterios de exclusión enfocado en el mercado japonés.

Cuentas: Sí. Tiene una modalidad de pago ( ¥315 —¥ 31,500), pero no he conseguido deducir las ventajas. Supongo que es para que tenga validez de prueba legalmente.

Velocidad de guardado / navegación: Lenta. La navegación es aceptable, tiene casi toda la información en un único lugar.

Otro sitio de archivado web, enfocado en el mercado japonés. No es excepcional pero nunca viene mal otra opción.

Limitaciones / desventajas / problemas: El idioma hace que sea necesario usarlo en Chromium o con alguna extensión de traducción (o usando Google Translate u otros en una nueva pestaña). Respeta no sólo el archivo robots.txt sino también la etiqueta META no-cache. No sigue el protocolo Memento. Parece que no puede ser archivada por WM.

Ventajas: Integra Archive.is y WM en la búsqueda. Tiene una esquema de búsqueda y archivado que se puede poner delante de una URL: gyo.tc/[URI], además aparece en grande nada más entrar en el sitio. Al ser una web japonesa y tener un público objetivo japonés, las páginas de dicho idioma se verán mejor en ocasiones que en otros servicios como WM o Archive.is (estos problemas sin embargo parecen cada vez menos frecuentes).

Tiene enlaces largos que sigue el esquema: "megalodon.jp/[año]-[mesdía]-[horaminutos]-[segundos]/[URI] y una URL corta alfanumérica.

Dispone de una botonera para compartir en Facebook, Twitter, Google+ (!), Line y Hatena (una red social japonesa). La calidad del archivado no es excepcional pero suele ser aceptable. Aunque falla en ocasiones (como todos). Nunca viene mal otra opción.

Tiene búsqueda mediante palabras clave y mediante URL de páginas "pescadas" anteriomente. Tiene una versión para "pescar" las páginas para que se vean bien en móviles (o las versiones móviles de los sitios web, no lo tengo muy claro).

Confiabilidad: Empresa privada: Affility.Co.,Ltd. La web permanece en línea desde hace 13 años aunque tienen problemas intermitentes (blog de la compañía).

Nombre: Archive.st. Archivador de propósito personal.

Fecha de lanzamiento: 2017.

Descripción: Sitio web de archivado bastante reciente y de tipo URL archivada / imagen.

Cuentas: No.

Velocidad de guardado: Estándar.

Otro sitio web de archivado muy reciente y algo simple.

Limitaciones / desventajas / problemas: No dispone de apartado de "navegación" porque la página está diseñada a realizar capturas sin proporcionar acceso a capturas anteriores. Tiene un recaptcha (en mi opinión son difíciles de resolver, puesto que fallan más que una persona), lo que impide que se pueda realizar un "botón de acciones de favoritos" o cualquier extensión. Tampoco dispone URL para ello. El formato de la URL es una mezcla entre alfanumérico, marca de tiempo (en palabras y en números). No sigue el protocolo Memento.

Ventaja: Es un archivador adicional. No obedece el archivo robots.txt. Al contrario que WebCite, donde la página desde donde se nos informa de las URL y otros datos relevantes no es recuperable, archive.st sí presenta dicha página, con el enlace corto. Las imágenes son bastante buenas, pero hay muchos otros servicios del estilo como este de Microsoft (a través de browserstacks, aunque se puede ver la publicidad, mientras que en el de archive.st no). Desde las imágenes se puede volver al archivo, borrando la sección correspondiente.

Confiabilidad: Es una empresa privada. El estilo es muy similar a otros muchos archivos que han desaparecido a lo largo del tiempo (como furl, mummify.it, etc., que mencionaré en el siguiente artículo). No es muy diferente a otros sitios surgidos anteriormente, como web-capture.net (2013).

En este artículo merecen mención, aunque hable de ellos en el futuro: Archivebox, Zotero y PageDash.

Bibliografía general

[A]: "Botones de acción" para archivado web por Jakeukalane, a partir de diversas fuentes o construidos por mí.

Pérez Morillo, M., Muguerza López I. (2011): El archivo web de la BNE. Consultado el 26 de marzo de 2019, archivado en webrecorder.io: webrecorder.io/webrecorderio/meneame/20190326184411/https://www.slides.

Lang, P. (2017): Users, technologies, organisations: towards a cultural history of world web archiving en Niels Brügger (ed.), Web 25: histories from the first 25 years of the World Wide Web.

Créditos de las imágenes (de las partes (A y B)

1: Milosz Kosmider / Foradian, traducida por Jakeukalane. Aquí el Error 404 original.

2: perma.cc, traducida por Jakeukalane.

3: Autor desconocido en su versión gif. Fair use.

N: Resto de imágenes: Jakeukalane.

Para los que no quieran esperar a un futuro artículo, en este enlace he reunido la mayoría de "botones de acción de favoritos" (bookmarklets) de todos estos servicios.

Para acabar, un pequeño tango.

Canción de Rubén Rubén del CD Eunucos Descalzos. Letra de Gus Fai. Voz de Pepe de Toffini.