SE::Yandex - Extractor de resultados de búsqueda de Yandex

Descripción general del extractor
El extractor de resultados de búsqueda de Yandex ocupa legítimamente un lugar en el TOP-5 de los extractores más demandados. Una de las principales ventajas competitivas de nuestro extractor es su colosal rendimiento. Gracias al funcionamiento multihilo de A-Parser, la velocidad de procesamiento de consultas puede alcanzar 3000-7000 consultas por minuto, lo que en promedio permite obtener hasta 5,000,000 de enlaces por minuto, con un consumo de recursos mínimo; cualquier computadora de oficina o doméstica, así como cualquier VDS de nivel de entrada, es adecuada para el trabajo. Nuestro extractor es compatible con todos los operadores de búsqueda de Yandex, lo que permite ampliar significativamente las posibilidades de extracción de datos. La estabilidad y continuidad de la extracción de resultados se garantiza mediante el reconocimiento de captchas a través de AntiCaptcha o cualquier otra API compatible (Anti-Captcha, RuCaptcha, CapMonster.cloud, 2captcha y otras).
La flexibilidad en la configuración permite especificar el tipo de resultados (móvil/escritorio), región, idioma, ordenación de resultados por fecha y mucho más. La funcionalidad de A-Parser permite guardar los ajustes de extracción para su uso posterior (ajustes preestablecidos), programar tareas de extracción y mucho más. Puede utilizar la generación automática de consultas, la sustitución de subconsultas desde archivos, y la combinación de caracteres alfanuméricos y listas para obtener la mayor cantidad posible de resultados.
El guardado de resultados es posible en la forma y estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit, que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.
Casos de uso del extractor
🔗 Resultados de Yandex y número de posición
Obtenemos los resultados de Yandex y el número de posición del resultado. El resultado se guarda en un archivo csv.
🔗 Extracción de datos de la versión lite de Yandex
En este artículo se examina un ejemplo de creación de un extractor para recopilar información de la versión lite del buscador Yandex.
🔗 Extracción de datos de publicidad de Yandex
El ajuste preestablecido analiza el bloque de anuncios en los resultados de búsqueda de Yandex y guarda el resultado en formato json.
🔗 Evaluación de la competencia en Yandex
El ajuste preestablecido determina la competencia en el motor de búsqueda Yandex por palabras clave.
🔗 Extractor de caché de Yandex
En el ajuste preestablecido se implementa la posibilidad de obtener enlaces a la caché del motor de búsqueda Yandex.
🔗 Extracción de solo fragmentos (snippets) de Yandex
Este ajuste preestablecido acepta como parámetro una palabra o frase para buscar en Yandex.
Datos recopilados

- Número de resultados por consulta
- Enlaces, anclajes y fragmentos (snippets) de los resultados
- También se recopila información sobre las etiquetas de cada resultado; actualmente se admiten: Date, Image Preview, Video, Rich snippet, Featured snippet
- Hora de la primera y última indexación en caché (solo para resultados de escritorio)
- Lista de palabras clave relacionadas (Related keywords)
- Determina si Yandex consideró la consulta como un error tipográfico o no
- Extracción del enlace a la caché de la página (solo para resultados de escritorio)
- Lista de nombres de iconos del sitio, así como sus tipos, si están presentes (incluyendo Turbo)
- Bloques publicitarios superiores, medios e inferiores de todas las páginas
- Enlace, enlace visible, anclaje, fragmento y dominio
- Enlaces y anclajes adicionales
- Estación de metro
- Palabras omitidas (palabras que pueden aparecer debajo de cada resultado con la nota "No encontrado")
- Lista de respuestas rápidas (Quick answers): preguntas, respuestas, enlaces a fuentes (se activa con la opción Parse Quick answers)
- Respuesta de IA (Búsqueda con Alice), su tipo y lista de fuentes
Capacidades
- Elección del tipo de resultados: móvil/escritorio
- Soporte para todos los operadores de búsqueda de Yandex (site:, lang:, etc.)
- Extrae el número máximo de resultados entregados por Yandex: 25 páginas de 50 elementos por resultado
- Posibilidad de buscar palabras clave relacionadas
- Admite la selección de región de búsqueda y dominio
- Posibilidad de ordenar los resultados por fecha
- Extrae el tiempo de indexación de la página, con posibilidad de filtrar resultados por este parámetro
- Opción de emulación de navegador (permite lograr una alta velocidad de extracción y bajo consumo de captchas)
- Posibilidad de omitir captchas utilizando el servicio AntiCaptcha o cualquier otro compatible con su API (se recomienda activar el parámetro is_russian en la configuración del servicio)
- Posibilidad de definir la cantidad de respuestas rápidas (Quick answers) que el extractor debe recopilar, haciendo clic en profundidad en cada pregunta
Basados en el extractor Yandex, funcionan los siguientes extractores:
SE::Yandex::Position - comprobación de posiciones del sitio por palabras clave en Yandex
Casos de uso
- Recopilación de bases de enlaces para A-Poster, XRumer, AllSubmitter, etc.
- Evaluación de la competencia para palabras clave
- Búsqueda de backlinks (menciones) de sitios
- Verificación de indexación de sitios
- Búsqueda de sitios vulnerables
- Cualquier otra variante que implique la extracción de datos de Yandex en una forma u otra
Consultas
Como consultas, se deben indicar frases de búsqueda, exactamente igual que si se introdujeran directamente en el formulario de búsqueda de Yandex, por ejemplo:
ventanas Madrid
lang:en windows Moscow
url:a-parser.com
site:a-parser.com
"a-parser.com"
Sustituciones de consultas
Puede utilizar macros integradas para multiplicar las consultas; por ejemplo, si queremos obtener una base de datos de foros muy grande, indicamos varias consultas principales en diferentes idiomas:
forum
foro
foro
论坛
En el formato de consulta indicaremos una iteración de caracteres de a a zzzz, este método permite rotar al máximo los resultados de búsqueda y obtener muchos resultados nuevos y únicos:
$query {az:a:zzzz}
Esta macro creará 475254 consultas adicionales por cada consulta de búsqueda inicial, lo que sumará 4 x 475254 = 1901016 consultas de búsqueda, una cifra impresionante, pero no es un problema para A-Parser. A una velocidad de 2000 consultas por minuto, esta tarea se procesará en solo 16 horas.
Uso de operadores
Puede utilizar operadores de búsqueda en el formato de consulta, de modo que se añadirán automáticamente a cada consulta de su lista:
site:$query
Cuentas
Para el funcionamiento del extractor
SE::Yandex pueden ser necesarias cuentas de Yandex. Las cuentas se pueden registrar con la ayuda del extractor
SE::Yandex::Register o simplemente añadir cuentas existentes al archivo files/SE-Yandex/accounts.txt en el formato compatible.
O bien, se puede activar el registro de cuentas "al vuelo".
Para trabajar utilizando la autorización por sesión, es necesario que la cadena de datos tenga este formato:
[email protected];MAQT78Z31Rinx4H;{"answer":"qmfhsxdcrk","proxy":"185.104.120.45:3128","session_id":"3:1748440908.5.0.1748440867459:ZXBxpg:47e4.1.2:1|2191075974.41.2.2:41.3:1748440908|3:10308131.797655.5pfkoRZWgLJGntKTlcUhYdysNfk"}
Variantes de salida de resultados
A-Parser admite un formateo flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma libre, así como estructurada, por ejemplo CSV o JSON
Exportación de lista de enlaces
Formato de resultado:
$serp.format('$link\n')
Ejemplo de resultado:
https://TestoMetrika.com/tests/
https://onlinetestpad.com/ru/tests
https://www.speedtest.net/
https://ustaliy.ru/testi/
https://yandex.ru/internet/
https://konstruktortestov.ru/popular
https://TestEdu.ru/test/
https://kto-chto-gde.ru/category/tests/
https://weekend.rambler.ru/tests/
https://GadalkinDom.ru/test
...
Enlaces + anclajes + fragmentos con posición
Formato de resultado:
[% FOREACH item IN serp; loop.count _ ' - ' _ item.link _ ' - ' _ item.anchor _ ' - ' _ item.snippet _ "\n"; END %]
Ejemplo de resultado:
1 - http://forum.r-rp.ru/ - <b>forum</b>.r-rp.ru -
2 - https://forum.arizona-rp.com/ - <div class=a11y-hidden>Resultado web con enlaces adicionales</div><b>Foro</b> – Arizona Role Play - Menú. Principal. <b>Foros</b>. Nuevos mensajes. ¿Qué hay de nuevo? Nuevos mensajes. Usuarios. Visitantes actuales. <b>Foros</b>. Entrada. ... Estadísticas del <b>foro</b>. Temas. 1,247,176. Mensajes. 5,225,340. Usuarios. 623,675.
3 - https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D1%83%D0%BC - <b>Foro</b> — Wikipedia - <b>Fó́rum</b> (lat. <b>forum</b> — arq. vestíbulo de la tumba; plataforma en el lagar para la uva a procesar; plaza del mercado, mercado de la ciudad; plaza central):
4 - https://zen.yandex.ru/media/propromotion/chto-takoe-forum-i-vse-chto-s-nim-sviazano-5d65164c1d656a00ad52ba30 - Qué es un <b>foro</b> y todo lo relacionado con él | Creativa... - Hoy hablaremos de qué es un <b>foro</b> y de todo lo relacionado con él con palabras sencillas y accesibles. Cada uno de nosotros busca encontrar a una persona con quien construir una comunicación basada en intereses comunes, compartir su experiencia, dar consejos. En el mundo moderno, todo esto se ha vuelto posible sin salir de casa. Precisamente una de las formas de tal contacto virtual es el web-<b>foro</b>.
5 - https://forum.vimeworld.ru/ - VimeWorld - <b>Foro</b> - <b>Foro</b> del proyecto de servidores de juego ideales de Minecraft - VimeWorld...
...
Salida de enlaces, anclajes y fragmentos en tabla CSV
La utilidad integrada $tools.CSVLine permite crear documentos tabulares correctos, listos para importar en Excel o Google Sheets.
Formato general de resultado:
[% FOREACH i IN p1.serp; tools.CSVline(i.link, i.anchor, i.snippet); END %]
Nombre del archivo:
$datefile.format().csv
Texto inicial:
Enlace,Ancla,Fragmento
En el Formato general de resultados se aplica el motor de plantillas Template Toolkit para mostrar el array $serp en un ciclo FOREACH.
En el nombre del archivo de resultados, simplemente cambie la extensión del archivo a csv.
Para que la opción "Texto inicial" esté disponible en el Editor de tareas, debe activar "Más opciones". En "Texto inicial", escriba los nombres de las columnas separados por comas y deje la segunda línea vacía.
Salida de bloques publicitarios
Formato de resultado:
$ads.format('$link - $anchor - $snippet\n')
Ejemplo de resultado:
http://yabs.yandex.ru/count/WcOejI_zO3C2vH80P1zY-_ryBtnaD0K0CmCnZYWCO000000u109mhiMfd8qUW07CkUOvY07Kyz3GCP01vCcQhIwO0PgqhFigk06qZQ3m6C01NDW1gkAR5E01kAZK4-W1y06W0kYCvAl-Wue5-0Bmwl7WeSQurUK1c0FRc3lkh0Ju1Bpr48W5lFKGa0MxjssW1Qxa1QW5hkG5i0Mkv0Mu1OYr9S05eTt90SW5aFn4YkWqZwuhO8VP1W00012H0000gGVlTvJIyeiV0R07W82O3BW7W0Nn1tjIyvgFUtz-X8A0WSIqXdB92j4AXC7wM-4_u3nZJEzt003CKjw5aRa50DaBw0kyzRAxthu1gGn-j62AsN3cl-WCemBW3OE0W4293eDHIPs09kwAqTFvwFMAi8VO3WAX3zaFW13WszlG4DcTXo9ZI0HkD3-n4YxXl0bOc-q2u1E8jIMW58Yr9QWKkxTjl9wVx0Ne58m2q1Mydf_i1TWLmOhsxAEFlFnZyA0Mq92TW0R95l0_q1Qokzw-0O4N0F0_c1UwdvGKg1S9m1Uq0jWNm8GzcHYW60wm68UTi806q1WX-1Yf-9keZlxncYM06R3qkEBGlP6v890P0Q0PmWEm6RWP____0T8P4dbXOdDVSsLoTcLoBt8qEJSjCkWPWC83y1c0mWE16l__WxZFMxv27W2GPM2khLr2HGBSgKCU4fSjR_apLy29ToVZBSaX0K10aLK2xDc6HsxyWlx3mqOzRTCnV7G7IDvEXnY4YqauFXdHmHcIWrcJNGT1NfMC_8eB8q1m1-WEYbKFtWBTZHwcD4A80G00~1?from=yandex.ru%3Bsearch%26%23x2F%3B%3Bweb%3B%3B0%3B&q=%D0%BA%D1%83%D0%BF%D0%B8%D1%82%D1%8C+%D0%B0%D0%B2%D0%B8%D0%B0%D0%B1%D0%B8%D0%BB%D0%B5%D1%82%D1%8B&etext=2202.wBaB7RlytlP_PRaU6jPhHD2nHBNT_4gSF6009OyJEfpWjUPoA5WrSJAqCfap0m9ReXhoaGRlaWhmYmllemF2ZA.f04b1271668949ea17ffcafcb11c72c2ab6454c5 - <b>Comprar</b> <b>billete de avión</b> hasta / aviasales.ru - Ofrecemos: <b>Comprar</b> <b>billete de avión</b> hasta aquí. ¡Superoferta! ¡Dese prisa!
http://yabs.yandex.ru/count/WgGejI_zO5e2rHG092HY-_ryhkYFF0K0MWCnZYWCO000000u109mhDZpa8WGW07ZZm680U2f-wrQa07AywxRoe20W0AO0ShphjjAk06oWAxe8C01NDW1e8MobW7W0TJCXm_e0O01c0BImFq2e0BuQjW20l02g_w3YWNu0l3gyU2XnhZLvG600vF6eiSFY0FStR-O39W3cyKxYga3-0JJpWI81TFE1905Z-zGe0MPj06e1PMM0R05bPO1k0NInnJ01TF1ZG781PNz8uheD8-kAs27sGO0000GaG000Aa7xtUKqlAB7m6m1u20c0ou1u05yGTxKlEQZtj_VeI2l3M02W712l_aZtPQIU8_oGeJ5NRdMhxJFweB4E0yOqplTm00p5BUXP6v1G3P2-WBqyu4y0i6Y0ookzw-0QaCu_jL-Yu3zB_e3AC2u0s3W810YGwgO5HI9w3dYj7J-UZrYh27s0u2-0x7dPAe2Q4FFGhNet0zzZ_P3_0_W13GmC4Rm92GPpgqxC9xJZC_iHAuM7p6uhZj0k0JqiSKe1JInnIe58_lKB0KYw381hWKmAo0jQI04TWK-FpP_WNe58m2q1Nu_Dd-1TWLmOhsxAEFlFnZyA0Mq92TW0R95j0MihlUlW615vWNfwZz3wWN2S0Nj0BO5y24FPaOe1WAi1Z9fB201j0O8VWOgVYRg8x-yPebW1cmzBZYqBsHkI2G6G6W6S83i1cu6V___m7I6H9vOM9pNtDbSdPbSYzoD3atBJBe6O320_0PWC83WHh__oD2TTsApne0jsLWrgrT_2INXiZt8r8kcvWxe0SCE37tPBmjEYG0203ecjreFlD0AY-khXXjgcFZa190IXd9BOrkl3guMzzraExES_xHXH4WwWDq1xIoUlHJ6Y74~1?from=yandex.ru%3Bsearch%26%23x2F%3B%3Bweb%3B%3B0%3B&q=%D0%BA%D1%83%D0%BF%D0%B8%D1%82%D1%8C+%D0%B0%D0%B2%D0%B8%D0%B0%D0%B1%D0%B8%D0%BB%D0%B5%D1%82%D1%8B&etext=2202.wBaB7RlytlP_PRaU6jPhHD2nHBNT_4gSF6009OyJEfpWjUPoA5WrSJAqCfap0m9ReXhoaGRlaWhmYmllemF2ZA.f04b1271668949ea17ffcafcb11c72c2ab6454c5 - <b>Comprar</b> <b>billete de avión</b> en línea en Tutu.ru! ¡Sitio oficial! - ¡Billetes de avión a bajo precio! ¡Vuelos ventajosos por todo el mundo! <b>¡Comprar</b> billete en línea!
http://yabs.yandex.ru/count/WcOejI_zO3C2vH80P1zY-_ryBtnaD0K0CmCnZYWCO000000u109mhiMfd8qUW07CkUOvY07Kyz3GCP01vCcQhIwO0PgqhFigk06qZQ3m6C01NDW1gkAR5E01kAZK4-W1y06W0kYCvAl-Wue5-0Bmwl7WeSQurUK1c0FRc3lkh0Ju1Bpr48W5lFKGa0MxjssW1Qxa1QW5hkG5i0Mkv0Mu1OYr9S05eTt90SW5aFn4YkWqZwuhO8VP1W00012H0000gGVlTvJIyeiV0R07W82O3BW7W0Nn1tjIyvgFUtz-X8A0WSIqXdB92j4AXC7wM-4_u3nZJEzt003CKjw5aRa50DaBw0kyzRAxthu1gGn-j62AsN3cl-WCemBW3OE0W4293eDHIPs09kwAqTFvwFMAi8VO3WAX3zaFW13WszlG4DcTXo9ZI0HkD3-n4YxXl0bOc-q2u1E8jIMW58Yr9QWKkxTjl9wVx0Ne58m2q1Mydf_i1TWLmOhsxAEFlFnZyA0Mq92TW0R95l0_q1Qokzw-0O4N0F0_c1UwdvGKg1S9m1Uq0jWNm8GzcHYW60wm68UTi806q1WX-1Yf-9keZlxncYM06R3qkEBGlP6v890P0Q0PmWEm6RWP____0T8P4dbXOdDVSsLoTcLoBt8qEJSjCkWPWC83y1c0mWE16l__WxZFMxv27W2GPM2khLr2HGBSgKCU4fSjR_apLy29ToVZBSaX0K10aLK2xDc6HsxyWlx3mqOzRTCnV7G7IDvEXnY4YqauFXdHmHcIWrcJNGT1NfMC_8eB8q1m1-WEYbKFtWBTZHwcD4A80G00~1?from=yandex.ru%3Bsearch%26%23x2F%3B%3Bweb%3B%3B0%3B&q=%D0%BA%D1%83%D0%BF%D0%B8%D1%82%D1%8C+%D0%B0%D0%B2%D0%B8%D0%B0%D0%B1%D0%B8%D0%BB%D0%B5%D1%82%D1%8B&etext=2202.wBaB7RlytlP_PRaU6jPhHD2nHBNT_4gSF6009OyJEfpWjUPoA5WrSJAqCfap0m9ReXhoaGRlaWhmYmllemF2ZA.f04b1271668949ea17ffcafcb11c72c2ab6454c5 - <b>Comprar</b> <b>billete de avión</b> hasta / aviasales.ru - Ofrecemos: <b>Comprar</b> <b>billete de avión</b> hasta aquí. ¡Superoferta! ¡Dese prisa!
...
Guardado de palabras clave relacionadas
Formato de resultado:
$related.format('$key\n')
Ejemplo de resultado:
<b>test</b> tanki online
tanki online
todos los <b>tests</b> punto ru
i exam ru pruebas
<b>test</b> de velocidad de internet
<b>tests</b>24.ru
speedtest
test<b>de rendimiento de pc</b> en línea
pruebas en línea
my <b>test</b> student cómo saber las respuestas
...
Para eliminar automáticamente las etiquetas HTML en el resultado, debe usar el Constructor de resultados, seleccionar el array $related y aplicar Remove HTML tags.
Competencia de palabras clave
Formato de resultado:
$query - $totalcount\n
Ejemplo de resultado:
todos los exámenes punto ru - 25000000
pruebas en línea - 13000000
tanki online - 7000000
i exam ru pruebas - 27000000
tests24.ru - 238000000
prueba de rendimiento pc en línea - 16000000
speedtest - 2000000
prueba de velocidad de internet - 16000000
test tanki online - 19000000
my test student cómo saber las respuestas - 16000000
Identificación de palabras clave con errores
Formato de resultado:
$query - $misspell\n
Ejemplo de resultado:
pruebas en línea - 0
prueba de velocidad de internet - 0
pruevas en linia - 1
prueba de velosidad de internet - 1
Verificación de indexación de enlaces
Formato de consulta:
site:$query
Formato de resultado:
$query.orig - $totalcount\n
Ejemplo de resultado:
https://a-parser.com/pages/buy - 2
https://a-parser.com/wiki/parsers - 16
https://trjkjfkdf.bg.ky - 0
https://a-parser.com/resources - 1000
https://a-parser.com/forum - 499
Para verificar la indexación de enlaces, coloque en el Formato de consulta el operador correspondiente: site:.
El formato de resultado se muestra como "url original - cantidad de páginas en el índice".
Como resultado, obtenemos la dirección de las páginas y su cantidad en el índice del buscador.
Si la página no está presente, el resultado será: 0.
Guardado en formato SQL
Formato de resultado:
[% FOREACH serp; "INSERT INTO serp VALUES('" _ query _ "', '"; link _ "', '"; anchor _ "')\n"; END %]
Ejemplo de resultado:
INSERT INTO serp VALUES('test', 'https://konstruktortestov.ru/popular', 'Populares <b>tests</b>')
INSERT INTO serp VALUES('test', 'https://TestoMetrika.com/tests/', '<b>Tests</b> c en línea con resultado preciso de psicológicos...')
INSERT INTO serp VALUES('test', 'https://ustaliy.ru/testi/', '<b>Tests</b> en línea: los mejores, interesantes y populares')
INSERT INTO serp VALUES('test', 'https://www.SunHome.ru/tests/Interesting_tests', '<b>Tests</b>. interesantes. Realizar interesantes psicológicos...')
INSERT INTO serp VALUES('test', 'https://onlinetestpad.com/ru/tests', '<b>Tests</b> en línea | Online Test Pad')
...
Volcado de resultados en JSON
Formato general del resultado:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.totalcount = p1.totalcount;
obj.links = [];
FOREACH item IN p1.serp;
obj.links.push(item.link);
END;
obj.json %]
Texto inicial:
[
Texto final:
]
Ejemplo de resultado:
[{"totalcount":113000000,"links":["https://TestoMetrika.com/tests/","https://konstruktortestov.ru/popular","https://ustaliy.ru/testi/","https://www.SunHome.ru/tests/Interesting_tests","https://GadalkinDom.ru/test","https://zen.yandex.ru/tes","https://onlinetestpad.com/ru/tests","https://kto-chto-gde.ru/category/tests/","https://psytests.org/top.html","https://MixTests.com/new/","https://TestEdu.ru/test/","https://testserver.pro/index","https://onedio.ru/tests","https://BankTestov.ru/","https://weekend.rambler.ru/tests/","https://edieta.org/testi","https://trikky.ru/?%21","https://BBF.ru/tests/","https://dropi.ru/c/tests/raznie","https://cadelta.ru/tests","https://www.Elle.ru/tests/","https://www.adme.ru/svoboda-psihologiya/polnyj-spisok-psihologicheskih-testov-dlya-poznaniya-sebya-kotorye-mozhno-projti-onlajn-2071715/","https://www.ellegirl.ru/tests/","https://test.tankionline.com/","https://vraki.net/onlajn-testy/","https://Lifehacker.ru/psixologicheskie-testy/","https://iq2u.ru/tests","https://www.b17.ru/tests/","https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82","https://gurutest.ru/test/","https://www.psychologies.ru/tests/","https://peopletalk.ru/category/tests/","https://obrazovaka.ru/testy","https://likeyou.io/category/test/","https://ProfTest.me/tests","https://TayniyMir.com/testy","https://psi-technology.net/psytest/","https://www.kp.ru/putevoditel/online-test/","https://tvoytest.ru/","https://twizz.ru/tests/","https://lunanews.net/testy/","https://www.ivi.ru/titr/tests","https://sntch.com/tests/","https://testy.online/","https://videouroki.net/tests/","https://www.speedtest.net/ru","https://rb.ru/tests/","https://aznaetelivy.ru/tests/","https://woman-psy.com/psihologicheskie-testy/testy_na_eruditsiyu_i_znaniya/interesnye_testy/","https://mamochka-club.com/psihologicheskie-testy/interesnye-testy/"]}]
Para que las opciones "Texto inicial" y "Texto final" estén disponibles en el Editor de tareas, debe activar "Más opciones".
Procesamiento de resultados
A-Parser permite procesar los resultados directamente durante la extracción; en esta sección presentamos los casos más populares para el extractor Yandex
Unificación de enlaces
Añadir unificación y en la lista desplegable seleccionar $serp.$i.link - Link.
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJx9VE2P2jAQ/SurEYdWQqvQLpfcWFSqVnTZLuyhohy8ZIJcHNu1HQqK+O+dCUkc
ttVeoszze/NtVxCE3/tHhx6Dh3Rdga3/IYXlpzT9IXSGx5u51Ht/86zl7xJhCFY4
j47p6x6LDjLMRakCDCsIJ4vkxBzQOZmxSmZkW2eOJ4fBSfSEHYQqmTZKkgTOb8jE
Drem1CFqRm/QFedr0bEsKsZJT1K2xVC5nHK6BqrJEsBi2AwbxupC95Sx3kGLflbm
RShIgyvxvNm0XvzMuEJw8wZ2dNt0sjtcigOuDB3mUsXIfkbWgyg4yiATAfn0Nq8d
vXt/G47sQWSZDNJooS4RuPcxajOYFLQhLv1yd2fOFAQFrB0weGqzW8OgtmOV3y8a
SHOhPA7BU6ozQYlkr09kQCeCcQvL+RBegdETpeZ4QBVptf/7UqqMFmWSk+hLI/w/
ZfGPj3NXXj8UDfqPoxw6L7V1v/gWVZmZmx1Vnr3UwyxkINtP6+1JISFwj2i7nj1w
zwrjsAvTeG6i092wqHmr4sgmNkJXZVyN5RrcGp3L3aLZ1JZZ6hVdwIWemsIq5Lp0
qRSNxeNTXI+Jb8bARkzwtXhah+DS23sIwRjlvy4vqVonaf3GnGBBnexHbVxuhVLP
T/P+CcSVIuNnmdzdfeDvx3H9P7ogwNqAO0NbRZWdN90r0b0tVf+tSKszjeqXf7yQ
uC6mEEYN8jQHvuB/AYBymo0=
Ver también: Unificación de resultados
Unificación de enlaces por dominio
Añadir unificación y en la lista desplegable seleccionar $serp.$i.link - Link. Seleccionar el tipo de unificación: Dominio.
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJx9VE2P2jAQ/SvI4tBKCIV2ueTG0lK1ost2YQ8V5WDIBLk4tms7FBTx33fGCXHY
VnuxPG/mzbddMc/dwT1acOAdS9cVM+HOUrb8nKY/ucrg1JsLdXC9ZyX+lNDbnnuf
dMGFYgNmuHVgibju2KMig5yX0rNBxfzZALrTR7BWZIBKkaFsrD6dLXgrwCF25LIk
s1GSJOzyBo3vYadL5SNn9Ia5pMwNWKJFxjjpUMpQFiqxcEo5XTOsySBAZLYZNBar
2jy71l6jX6TecslSb0u4bDZXL26mbcGpjX0zGjY9bZVLfoSVRmUuZIzsZig98IKi
9DPugbTDPDh6937oT+SBZ5nwQisu6wjU+xi1HhHylUZbvFJ3Z1YXCHkIDgg8X7Nb
s36QY5U/ag5Lcy4dDJjDVGccE8lea4QHy722C0P5IF4xrSZSzuEIMpoF//elkBku
yiRH0teG+H+TxT8+Lm153VA46L8Wc2i9BOl+8T2yMj3XexrZNgyzEB5lNw3bk7IE
wQOAaXv2QD0rtIU2TOO5iY6vxICirYojm5gI3ZRxM5ZbcKdVLvaLZlOvlqVa4VNc
qKkujASqS5VS4lgcPMX1mLhmDCTEBF+TpyEElX59h8xrLd23ZZ2qsQLXb0wJFtjJ
btTG5Y5L+fw072pYXCkUfpXJ3d0HOj+Ow31UI4y4HvYatworu2zaX6L9ZaruX5FW
FxzVb/dYG1FdZIIYNsjhHOiBvwAa7J3h
Ver también: Unificación de resultados
Extracción de dominios
Añadir Constructor de resultados y en la lista desplegable seleccionar la fuente: $p1.serp.$i.link - Link. Seleccionar el tipo: Extract Domain.
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJx9VEtv2zAM/isFkcMGBIGzNRff0qwBNmRN17SHIetBi+lAiyxpkpwlMPzfR8qO
7XZDL4b5+Eh+fKiCIPzB3zv0GDyk2wps/IcUNrdp+l3oDE9Xt6fgxC5cfTKFkNrD
GKxwHh0jtgNHMmSYi1IFGFcQzhYpjjmiczJDMsqMZOvM6ewwOIkc6ShUyW7TJEmg
fgMm9rgzpQ49ZvqGu5L64C06hvWIWVI/P4+BKFKNfmlcIZjqyE4nLe/OuBFHfDRk
zKXCXr0k6U4UnHKUiYBsneQx0Lv3k3DiCCLLZJBGC9Vk4Db1WZ+0/B0Za0O+9MuN
WDpTkCpgDMDK86W6LYyiDBSijNhvDQbSXCiPY/BU6lJQIdlriwzoRDBubbke0ldg
9FypFR5R9W4x/k0pVUYznecE+twC/++y/idG3dEbpqKZ/HFUQxclSjfrrz0qMyuz
J+bZT+KtZCEDyX4RB51CQsoDou16dsc9K4zDLk0buc1Om2xR8wL0I5vbXvWCxoux
DJQVeFO6HeXbJuMt0KLbWJw+AG9Pu3HYHEVzEzx158SZ9K17MO0WQk2YndG53K/b
Jb1kLvUjnd9aL0xhFXKfdKkUjdnjQ79uc9+OlYWe8GvwIqbgVl5OkGowyn/ZNNSt
k1TSjAkXNJlh1jbkTij19LAaWqBfURJ+lMn19Qf+fpzF/2mjAcYG3BvaUmLGhNsH
ontZquEzkVY1jf6Xv2+cmBe7kI4a5GmufNt/AaiMmIc=
Ver también: Constructor de resultados
Eliminación de etiquetas de anclajes y fragmentos
Añadir Constructor de resultados y en la lista desplegable seleccionar la fuente: $p1.serp.$i.anchor - Anchor. Seleccionar el tipo: Remove HTML tags.
Añadir de nuevo el Constructor de resultados y en la lista desplegable seleccionar la fuente: $p1.serp.$i.snippet - Snippet. Seleccionar el tipo: Remove HTML tags.
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJyVVN9v2jAQ/lcii4dNQihs5SVvFA11Ey0dtA8T64NHLszDsT3bYaCI/313jknS
rqq0lyi+u++7X59dM8/d3t1bcOAdyzY1M+GfZWz9Kcu+cZXDMVlBqQ+Q3DzcLhLP
dy4prC6Tqdr+1NYlGJOslTCGKIbMcOvAEtmmx4GOHApeSc+GNfMnA5gCSa0VOaBT
5Hg2Vh9PFrwVQEwHLisKG6dpys5vwPgOtrpSvsOM3wiXQu2dAUuwDjFJz09PQ4bd
Y41urm3JaQoDMx7FkbTONT/Ag0ZnISR05jme7nhJKQc590DeURGI3r0f+SMx8DwX
XmjFZZOBxtRlfVTid+hYaYzFXxrEHGeNJg+BgIynS3UbNghnhhRVwH5tMCwruHQw
ZA5LnXMsJH/pER4s99ouDdWD9pppNZVyAQeQXVjgv66EzHGn0wJBnyPw9ZDlPxzn
tr1+KtzJH4s1tCzhdL287VC5Xugddp7/wL6lKIXHs5uFRWcsReMewLQzu6OZldpC
myYyx+wocgOKBNCtbGo607M2nq2lZ6yZ05XdYr5NOtwwFLqhrYabwEg/UXM23Jgb
X0pyW8tPaIzRnqQTISTT1xhdc5/+i/KCOSNmq1Uhdsuo/Es7lXrA675UM10aCTR8
VUmJ2nGw6jQ8dVErdOim+BI8CyloP5d7jWVo6b6sm3kaK7CqyTAW3s8aKbdcysfV
ou9hne7x8L1Kr64+0PfjJPyPGwsjrIedRuljZ9RwfHXal6zuvz1ZfUY9/XL3TRD1
RSFowwE5FAs9GH8BhLW+Jg==
El Constructor de resultados se puede añadir tantas veces como necesite.
Ver también: Constructor de resultados
Filtrado de enlaces por inclusión
Añadir un filtro y en la lista desplegable seleccionar: $serp.$i.link - Link. Seleccionar el tipo: Contiene la cadena. Luego, en Cadena proscribir el criterio de filtrado; por ejemplo, si queremos que en el resultado solo se guarden los enlaces que contienen .com, escribimos eso en "Cadena".
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJx9VE2P2jAQ/SvI4tBKCMFhL7mxqEit6LJd2EOFOHjxJHJxbNd2KCjKf++ME+Kw
rfaW+Xhv3nw4NQvcn/yzAw/Bs2xfMxu/Wca2X7LsJ9cCLqOVVAGc1MXo7TryIX5J
PVJSn9iEWe48OELvByAMCMh5pQKb1CxcLSCnOYNzUgAGpUDbOnO5OkBG8Og7c1VR
2nw2m7HmAxgv4GgqHRJm/kE66fQWHMES4mE2gOSxQwxi9yQ52zPsyaIjNnmYdBm7
Nv1odOBSDyRPj6ZE09ggjUbbg/asORxujH5lXMlprmM7n3ZD7oNbfoadaXVAcuPc
4YmXxD8WPABFp3kk+vR5Gi7EwIWQVJOrtgLtIVV91fJ31KcN5uInTXrlUGvGAkQC
cl5v6vZsHG3quIrYHy2GZTlXHibMo9QVRyHifUTifHgwbhNngP6aGb1Qag1nUCkt
8j9WUgk8mkWOoK8d8P8pm384mr69YSlc+h+HGnqWaD1uvieUMGtTYOfiLS62lAFt
v4yXlLEZOk8Atp/ZE82sNA76Mh1zVx2fjQVNF5ZWtrDJddfG3VrunXhNuSw23dXe
Miu9w7e50UtTWgXUl66UwrV4eEnnsfDdGshIAt+Dl7EEtX57kywYo/y3bSvVOonn
90ACS5zksGpHeeRKvb6shxGWTiqekyfaI95pYfCCsIvm0P8d+l9MPfxHZHWDa/nl
n9sk6oFS0IfD8PElzZu/Z6ed/A==
Ver también: Filtros de resultados
Configuraciones posibles
| Nombre del parámetro | Valor por defecto | Descripción |
|---|---|---|
| AntiGate preset | default | Selección de ajuste preestablecido Util::AntiGate, más detalles sobre la configuración aquí |
| AntiGate preset for old captcha | default | Similar a AntiGate preset, pero se utiliza solo para captchas convencionales (antiguas, en forma de una sola imagen). Si no se selecciona un ajuste preestablecido aquí, se utilizará el seleccionado en AntiGate preset. |
| Experimental img captcha max count | 5 | Número máximo de reintentos de imágenes de captcha por intento |
| Preffered captcha type | Click | Elección del tipo de captcha preferido: Click o Puzzle |
| Engine | HTTP (Fast, JavaScript Disabled) | Permite elegir el motor: HTTP (más rápido, pero mayor probabilidad de captchas) o navegador (más lento, pero menor probabilidad de captchas) |
| Device | Modern desktop computer (Windows 10, Chrome 84) | Elección del tipo de resultados (Desktop computer / Mobile device) |
| Pages count | 5 | Número de páginas a extraer (de 1 a 25) |
| Sort serp by date | ☐ | Ordenación de resultados por fecha |
| Serp time | All time | Período de búsqueda |
| Yandex domain | www.yandex.ru | Dominio de Yandex para la extracción; se admiten todos los dominios (.ru, .ua, .by, .kz, .com.tr, .com). A partir de la versión 1.1.345 se selecciona automáticamente según la región elegida. |
| Region of serp (lr=) | Moscú | Selección de la región de búsqueda (parámetro lr=) |
| Custom region ID | Posibilidad de indicar el ID de una región que no figure en el campo de selección. Esta opción tiene prioridad sobre la opción Region of serp (lr=). Es obligatorio definir el dominio correspondiente en Yandex domain. | |
| Search sites from (rstr=) | Not set | Elección de la vinculación regional de los sitios (parámetro rstr=) |
| Language | Any | Idioma de los resultados de búsqueda (Russian, English, Belorussian, French, German, Indonesian, Kazakh, Tatar, Turkish, Ukrainian) |
| Parse not found | ☑ | Determina si se deben extraer los resultados si se encuentran cero resultados para la consulta buscada y se ofrecen resultados para otra consulta |
| Not personalized | ☐ | Personalización de la búsqueda. Más detalles aquí |
| Filter pages | Moderate filter | Filtrado de resultados de contenido no deseado (Family search / Moderate filter / Do not filter) |
| Use Accounts | ☐ | Trabajo con cuentas existentes en el archivo files/SE-Yandex/accounts.txt. SE::Yandex::Register - Permite registrar cuentas en Yandex |
| Remove bad accounts | ☑ | Eliminación de cuentas no válidas |
| Quick answers count | 0 | Número máximo de preguntas-respuestas (Respuestas rápidas) por cada consulta que el extractor debe recopilar |
| Parse generative answer | ☐ | Indica si se debe extraer la respuesta generativa (esto añade una subconsulta adicional y, por lo tanto, ralentiza el trabajo general) |
| Accounts | Only from "accounts.txt" | Elección del método de trabajo con cuentas: Always auto register - registrar siempre automáticamente cuentas "al vuelo", requiere seleccionar un ajuste preestablecido configurado en el parámetro SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - primero se usan las cuentas existentes de accounts.txt, y si se agotan, se usa el registro automático "al vuelo", para lo cual se debe seleccionar un ajuste preestablecido configurado en el parámetro SE::Yandex::Register preset. Only from "accounts.txt" - usar solo cuentas existentes de accounts.txt, y si se agotan, esperar el tiempo definido (parámetro Wait new accounts in "accounts.txt") a que aparezcan nuevas. Only by session_id from "accounts.txt" - autorización por cookies. |
| Remove bad accounts | Always, except wrong login/password | Eliminación automática de cuentas "malas": Always - eliminar siempre. Always, except wrong login/password - eliminar siempre, excepto cuando Yandex informe que el usuario/contraseña son incorrectos. El hecho es que Yandex puede dar este mensaje al bloquear una IP para una cuenta totalmente operativa, por lo que opcionalmente se pueden dejar dichas cuentas para su reutilización. Never - no eliminar nunca. Independientemente de la variante elegida, las cuentas no se eliminan en caso de errores de proxy/navegador |
| Use sessions | ☑ | Uso de sesiones |
| Wait new accounts in "accounts.txt" | 0 | Tiempo de espera para la aparición de nuevas cuentas en accounts.txt |
| SE::Yandex::Register preset | default | Elección del ajuste preestablecido de configuración para SE::Yandex::Register |
| Force neuro | ☐ | Activación forzada de la respuesta neuronal, similar al cambio manual entre "Búsqueda" y "Búsqueda con Alice" |
