Ir al contenido principal

Rank::Archive - Extractor de fecha de primera y última caché de un sitio en Web Archive

Descripción del extractor

Descripción del extractorRank::ArchiveRank::Archive – extractor de Web Archive, determina la fecha de la primera y última indexación, así como el número de copias guardadas del sitio.

La funcionalidad de A-Parser permite guardar la configuración de extracción del extractor Rank::Archive para su uso posterior (ajustes preestablecidos), establecer programas de extracción de datos y mucho más.

Es posible guardar los resultados en el formato y la estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit, que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.

Datos recopilados

  • Fecha del primer almacenamiento en caché
  • Fecha del último almacenamiento en caché
  • Número de copias guardadas del sitio
Datos recopilados

Casos de uso

  • Comprobar la existencia de una copia del sitio en el archivo web, así como las fechas de indexación de la primera y última copia
  • Evaluación de dominios: un gran número de copias del sitio en el archivo web puede indicar un alto tráfico en el sitio

Consultas

Como consultas, es necesario especificar el dominio del sitio buscado, por ejemplo:

a-parser.com
www.yahoo.com
google.com
vk.com
youtube.com

Ejemplos de salida de resultados

A-Parser admite un formateo flexible de los resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en cualquier forma, así como en formatos estructurados como CSV o JSON

Salida por defecto

Formato del resultado:

$query: $first - $last ($times times)\n

El resultado muestra el sitio, las fechas de indexación de la primera y última copia y el número de copias guardadas del sitio:

vk.com: 11.05.2000 - 21.05.2014(8965 times)  
youtube.com: 28.04.2005 - 21.05.2014(28150 times)
a-parser.com: 16.03.2012 - 17.05.2014(56 times)
google.com: 11.11.1998 - 21.05.2014(34575 times)
www.yahoo.com: 17.10.1996 - 20.05.2014(28537 times)

Guardado en formato SQL

Formato del resultado:

[% "INSERT INTO archive VALUES('" _ query _ "', '" _ first _ "', '" _ last _ "', '" _ times _ "')\n" %]

Ejemplo de resultado:

INSERT INTO archive VALUES('http://a-parser.com/', '16.03.2012', '16.01.2021', '290')
INSERT INTO archive VALUES('http://yandex.ru/', '06.12.1998', '25.03.2021', '141421')
INSERT INTO archive VALUES('http://facebook.com/', '12.12.1998', '25.03.2021', '4877156')
INSERT INTO archive VALUES('http://vk.com/', '11.05.2000', '25.03.2021', '172132')
INSERT INTO archive VALUES('http://google.com/', '11.11.1998', '25.03.2021', '5969502')
INSERT INTO archive VALUES('http://youtube.com/', '28.04.2005', '25.03.2021', '2309673')

Volcado de resultados en JSON

Formato general del resultado:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.query = query;
obj.first = p1.first;
obj.last = p1.last;
obj.times = p1.times;

obj.json %]

Texto inicial:

[

Texto final:

]

Ejemplo de resultado:

[
{"first":"12.12.1998","query":"http://facebook.com/","last":"25.03.2021","times":4877156},
{"first":"06.12.1998","query":"http://yandex.ru/","last":"25.03.2021","times":141421},
{"first":"16.03.2012","query":"http://a-parser.com/","last":"16.01.2021","times":290},
{"first":"28.04.2005","query":"http://youtube.com/","last":"25.03.2021","times":2309673},
{"first":"11.11.1998","query":"http://google.com/","last":"25.03.2021","times":5969502},
{"first":"11.05.2000","query":"http://vk.com/","last":"25.03.2021","times":172132}
]
sugerencia

Para que las opciones "Texto inicial" y "Texto final" estén disponibles en el Editor de tareas, debe activar "Más opciones".

Configuraciones posibles