SE::Yandex::Video - extractor de Yandex Video

Descripción del extractor
Extractor de búsqueda de videos en Yandex. Gracias al extractor SE::Yandex::Video, podrá obtener bases de datos de enlaces a videos. Puede utilizar las consultas de la misma forma en que las introduce en la barra de búsqueda de Yandex.
La funcionalidad de A-Parser permite guardar los ajustes de extracción de Yandex para su uso posterior (ajustes preestablecidos), programar la extracción y mucho más. Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, el rastreo de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
Es posible guardar los resultados en el formato y la estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit, que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.
Datos recopilados
- Enlaces a videos
- Anclajes (anchors)
- Fragmentos (snippets)
- Nombre del servicio donde se aloja el video
- Duración, número de visualizaciones y fecha de publicación
- Enlaces al póster y vista previa del video
- Resumen breve del video
- Lista de secciones en el video
- Código para insertar en sitios web

Características
- Soporte para filtros (cortos, recientes)
- Selección del número de páginas de resultados
- Soporte para sesiones
Casos de uso
- Recopilación de videos para alimentar blogs, sitios de videos, doorways...
- Recopilación de datos de texto
Consultas
Como consultas, es necesario indicar frases de búsqueda, por ejemplo:
Cats
Football
Waterfall
Speak in english
cars
Sustituciones en consultas
Puede utilizar los macros integrados para multiplicar las consultas; por ejemplo, si queremos obtener una base de datos muy grande de foros, indicaremos varias consultas principales en diferentes idiomas:
forum
foro
foro
论坛
En el formato de consulta, indicaremos un recorrido de caracteres de a a zzzz; este método permite rotar al máximo los resultados de búsqueda y obtener muchos resultados nuevos y únicos:
$query {az:a:zzzz}
Este macro creará 475254 consultas adicionales por cada consulta de búsqueda inicial, lo que en total dará 4 x 475254 = 1901016 consultas de búsqueda; una cifra impresionante, pero que no supone ningún problema para A-Parser. Con una velocidad de 2000 consultas por minuto, esta tarea se procesará en solo 16 horas.
Opciones de salida de resultados
A-Parser admite un formateo flexible de los resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como en forma estructurada, por ejemplo, CSV o JSON.
Salida por defecto
Formato del resultado:
$serp.format('$link\n')
Ejemplo de resultado:
http://www.youtube.com/v/lcYzh7IjJj0
http://www.youtube.com/watch?v=VD2h2YUY_WQ
http://www.youtube.com/watch?v=UPOUE8ObCy8
http://www.youtube.com/watch?v=Ha9Q1kHqCHA
http://www.youtube.com/watch?v=P5rlifhgewY
https://zen.yandex.ru/video/watch/61099fa859eaef364db8b3cd?f=video
http://www.youtube.com/v/-cvEA8897Fc?fs=0
https://zen.yandex.ru/video/watch/625ed4e3099b9b7b81b17e3b?f=video
http://rutube.ru/video/016773a106036e9d3cd619ace97011e0/
http://rutube.ru/video/e54b2392b7dd3fe57fed6002aba5f833/
http://rutube.ru/video/8fe868740089c3557d6d54e86ceca6a1/
http://www.youtube.com/v/OuOK2fEPdMU
http://www.youtube.com/watch?v=UcbmVFYp4Lg
http://www.youtube.com/watch?v=JgJE4oQf-Gs
http://www.youtube.com/watch?v=ektN1-ptnDE
Salida en tabla CSV
Formato del resultado:
[% FOREACH item IN serp;
tools.CSVline(query, item.link, item.anchor, item.prevPoster, item.duration, item.views);
END %]
Ejemplo de resultado:
test,http://www.youtube.com/v/lcYzh7IjJj0,"<b>Prueba</b> de IQ con 10 fotos",https://avatars.mds.yandex.net/get-vthumb/4322300/5f649751351f727400bfd1be494fd6b4/564x318_1,07:09,"2,5 millones de visualizaciones"
test,http://www.youtube.com/watch?v=VD2h2YUY_WQ,"Online <b>Test</b> Pad -cómo crear uno mismo una <b>prueba</b>",https://avatars.mds.yandex.net/get-vthumb/1023253/fffa43fb9402c436d6881537bb9aee9a/564x318_1,05:38,"16,6 mil visualizaciones"
test,http://www.youtube.com/watch?v=UPOUE8ObCy8,"Prueba educativa sencilla. <b>prueba</b>. Online <b>Test</b> Pad",https://avatars.mds.yandex.net/get-vthumb/3435353/fa94c2b60d9bb0fa8cda2d469b6dcf0a/564x318_1,04:16,"76,5 mil visualizaciones"
test,http://www.youtube.com/watch?v=Ha9Q1kHqCHA,"Creamos <b>pruebas</b> con Online <b>Test</b> Pad #2",https://avatars.mds.yandex.net/get-vthumb/2032788/4ffd2b149fbfc3de17b67ef92290028e/564x318_1,07:00,"1704 visualizaciones"
test,http://www.youtube.com/watch?v=P5rlifhgewY,"Esta prueba de IQ-<b>prueba</b> de 5 preguntas mostrará su nivel de inteligencia",https://avatars.mds.yandex.net/get-vthumb/4507451/f3475d744f7841b40912dd933dce65c1/564x318_1,08:01,"606 mil visualizaciones"
test,https://zen.yandex.ru/video/watch/61099fa859eaef364db8b3cd?f=video,"Spotlight 4 grado. Prueba final. <b>prueba</b>. Exit <b>test</b>",https://avatars.mds.yandex.net/get-vthumb/3304426/beaeeaba5bfc6c00bcae50c4fa7cf236/564x318_1,09:39,
test,http://www.youtube.com/v/-cvEA8897Fc?fs=0,"English grammar <b>test</b>",https://avatars.mds.yandex.net/get-vthumb/2428342/b5b8a32f0260ce4ac785b6a4f1a8b006/564x318_1,12:35,"597 mil visualizaciones"
test,https://zen.yandex.ru/video/watch/625ed4e3099b9b7b81b17e3b?f=video,"ESTAS respuestas las conocen pocos ""Brain <b>Test</b>"" #1",https://avatars.mds.yandex.net/get-vh/5811343/2a00000180429688a113593b8944b066f53d/564x318_1,17:07,
test,http://rutube.ru/video/016773a106036e9d3cd619ace97011e0/,"¿Cómo pasar el juego Brain <b>Test</b> 2? Respuestas a todos los niveles",https://avatars.mds.yandex.net/get-vthumb/4407993/aa07260f286afde40d15abad02f816af/564x318_1,1:29:03,
test,http://rutube.ru/video/e54b2392b7dd3fe57fed6002aba5f833/,"Brain <b>Test</b> Recorrido completo № 4 Sumergiéndonos en el mundo de los acertijos",https://avatars.mds.yandex.net/get-vthumb/467972/c078458de66e698c5680527352261b9d/564x318_1,26:23,
test,http://rutube.ru/video/8fe868740089c3557d6d54e86ceca6a1/,"SpeedTest - Prueba de velocidad de conexión a internet",https://avatars.mds.yandex.net/get-vthumb/3446066/7cca0b8914479dcfe294b06246ea6df8/564x318_1,05:16,"223 mil visualizaciones totales"
Guardado en formato SQL
Formato del resultado:
[% FOREACH serp;
"INSERT INTO serp VALUES('" _ query _ "', '";
link _ "', '";
snippet.replace("\n", '\n') _ "', '";
summary.replace("\n", '\n') _ "')\n";
END %]
Ejemplo de resultado:
INSERT INTO serp VALUES('test', 'http://www.youtube.com/v/lcYzh7IjJj0', '', '00:25 Acertijo con tablas\nPregunta: ¿cuántas tablas hay aquí?\nRespuesta: ninguna, ya que se han dibujado líneas adicionales en las tablas y una tabla pasa suavemente a la otra\n01:10 Acertijo con las patas del elefante\nPregunta: ¿cuántas patas tiene el elefante?\nRespuesta: el elefante tiene una pata, situada detrás, y todas las demás patas no son reales\n02:00 Acertijo con la mujer en la ventana\nPregunta: ¿en qué se diferencian estas dos imágenes?\nRespuesta: en la esquina inferior derecha hay una madriguera de ratón')
INSERT INTO serp VALUES('test', 'http://www.youtube.com/watch?v=VD2h2YUY_WQ', '', '00:01 Introducción\nEl video habla sobre el sitio online test pad, donde se pueden crear pruebas, encuestas, crucigramas y juegos de lógica.\nPara empezar, es necesario registrarse con un correo electrónico.\n00:35 Creación de una prueba\nDespués del registro, se pueden crear sus propias pruebas, encuestas, crucigramas y juegos de lógica.\nEl video demuestra la creación de una prueba desde cero.\n01:06 Opciones de preguntas\nEl video muestra cómo crear diferentes opciones de preguntas: selección única, entrada de texto, completar espacios en blanco y otros.\nSe muestran ejemplos de preguntas y respuestas para cada opción.')
INSERT INTO serp VALUES('test', 'http://www.youtube.com/watch?v=P5rlifhgewY', '', '00:00 Introducción\nEl video es una prueba de IQ que consta de cinco preguntas, que ayudará a determinar el nivel de inteligencia.\n04:00 Resultados de la prueba\nSi se eligen las primeras opciones de respuesta, el nivel de felicidad es alto y la inteligencia es media.\nSi se eligen las segundas opciones de respuesta, el nivel de inteligencia es alto y el nivel de felicidad es medio.\nSi se eligen diferentes opciones de respuesta, el nivel de inteligencia y felicidad se encuentra en el punto medio.\n07:08 Conclusión\nEl video invita a compartir los resultados de la prueba con amigos y a suscribirse al canal.\nSi alcanzan los 50 mil likes, prepararán otra prueba.')
INSERT INTO serp VALUES('test', 'https://zen.yandex.ru/video/watch/625ed4e3099b9b7b81b17e3b?f=video', '"Brain <b>Test</b>" ► Recorrido DISFRUTEN LA VISUALIZACIÓN :) Enlaces: Música en el Video: https://www.youtube.com/watch?v=5qap5aO4i9A Discord Servidor ► https://discord.gg/4JWEu9URwB YouTube ►...', '')
INSERT INTO serp VALUES('test', 'http://rutube.ru/video/016773a106036e9d3cd619ace97011e0/', 'Pasé el juego Brain <b>Test</b> 2. Comparto las respuestas de todos los niveles. Recorrido del juego Brain <b>Test</b> 2 todas las partes: Adelgazamos con Nastya Fuga de la prisión Agente Bames Jond Familia Sabelotodo Cazador de monstruos Vanya...', '')
INSERT INTO serp VALUES('test', 'http://rutube.ru/video/e54b2392b7dd3fe57fed6002aba5f833/', 'https://www.youtube.com/channel/UCgpWRYOfFZ0whXZ8F26KbUg Canal en YouTube https://t.me/DimaDaimont canal de Telegram https://www.donationalerts.com/r/dimadaimont2 ayudar con el desarrollo...', '')
Volcado de resultados en JSON
Formato general del resultado:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.query = query;
obj.videos = [];
FOREACH item IN p1.serp;
obj.videos.push({
link = item.link
anchor = item.anchor
snippet = item.snippet
service = item.service
embed = item.embed
});
END;
obj.json %]
Texto inicial:
[
Texto final:
]
Ejemplo de resultado:
[{
"videos": [
{
"embed": "<iframe src=\"//www.youtube.com/embed/lcYzh7IjJj0?enablejsapi=1&wmode=opaque\" frameborder=\"0\" scrolling=\"no\" allowfullscreen=\"1\" allow=\"autoplay; fullscreen; accelerometer; gyroscope; picture-in-picture\" aria-label=\"Video\"></iframe>",
"link": "http://www.youtube.com/v/lcYzh7IjJj0",
"snippet": "",
"anchor": "<b>Prueba</b> de IQ con 10 fotos",
"service": "YouTube"
},
{
"embed": "<iframe src=\"//www.youtube.com/embed/VD2h2YUY_WQ?enablejsapi=1&wmode=opaque\" frameborder=\"0\" scrolling=\"no\" allowfullscreen=\"1\" allow=\"autoplay; fullscreen; accelerometer; gyroscope; picture-in-picture\" aria-label=\"Video\"></iframe>",
"link": "http://www.youtube.com/watch?v=VD2h2YUY_WQ",
"snippet": "",
"anchor": "Online <b>Test</b> Pad -cómo crear uno mismo una <b>prueba</b>",
"service": "YouTube"
},
{
"embed": "<iframe src=\"//www.youtube.com/embed/UPOUE8ObCy8?enablejsapi=1&wmode=opaque\" frameborder=\"0\" scrolling=\"no\" allowfullscreen=\"1\" allow=\"autoplay; fullscreen; accelerometer; gyroscope; picture-in-picture\" aria-label=\"Video\"></iframe>",
"link": "http://www.youtube.com/watch?v=UPOUE8ObCy8",
"snippet": "",
"anchor": "Prueba educativa sencilla. <b>prueba</b>. Online <b>Test</b> Pad",
"service": "YouTube"
},
{
"embed": "<iframe src=\"//www.youtube.com/embed/Ha9Q1kHqCHA?enablejsapi=1&wmode=opaque\" frameborder=\"0\" scrolling=\"no\" allowfullscreen=\"1\" allow=\"autoplay; fullscreen; accelerometer; gyroscope; picture-in-picture\" aria-label=\"Video\"></iframe>",
"link": "http://www.youtube.com/watch?v=Ha9Q1kHqCHA",
"snippet": "",
"anchor": "Creamos <b>pruebas</b> con Online <b>Test</b> Pad #2",
"service": "YouTube"
}
],
"query": "test"
}]
Para que las opciones "Texto inicial" y "Texto final" estén disponibles en el Editor de tareas, debe activar "Más opciones".
Ajustes posibles
| Parámetro | Valor por defecto | Descripción |
|---|---|---|
| Pages count | 5 | Número de páginas para extraer |
| New videos | ☐ | Videos recientes |
| Short videos | ☐ | Videos cortos |