SE::Google - Extractor de resultados de búsqueda de Google

Resumen del extractor
El extractor de resultados de búsqueda de Google es uno de los más solicitados, gracias a él podrá obtener enormes bases de datos de enlaces listos para su uso posterior. Puede utilizar las consultas de la misma forma en que las introduce en Google, incluidos los operadores de búsqueda (inurl, intitle, etc.).
El extractor de Google admite la multiplicación automática de consultas, por lo que puede estar seguro de que obtendrá el máximo número de resultados de la búsqueda. Además, A-Parser puede navegar automáticamente por consultas relacionadas hasta la profundidad especificada. Gracias al funcionamiento multihilo de A-Parser, la velocidad de procesamiento de consultas puede alcanzar de 3000 a 7000 consultas por minuto, lo que permite obtener un promedio de hasta 500,000 enlaces por minuto.
La funcionalidad de A-Parser permite guardar la configuración de la extracción de datos para su uso posterior (ajustes preestablecidos), establecer programas de extracción y mucho más. Puede utilizar la multiplicación automática de consultas, la sustitución de subconsultas desde archivos, la generación de combinaciones alfanuméricas y listas para obtener la mayor cantidad posible de resultados.
Es posible guardar los resultados en el formato y la estructura que necesite, gracias al potente motor de plantillas integrado Template Toolkit, que permite aplicar lógica adicional a los resultados y exportar datos en varios formatos, incluidos JSON, SQL y CSV.
Casos de uso del extractor
🔗 Extracción de dominios
Extracción de datos de dominios temáticos por frase clave de Google y obtención de varios parámetros de los dominios
🔗 Extracción de Google News
Este ajuste preestablecido extrae noticias de Google por consulta de búsqueda y recopila las fechas de estas noticias
🔗 Verificación de indexación
El ajuste preestablecido verifica la indexación de las páginas del sitio en Google, recorriendo la lista de enlaces especificados
🔗 Evaluación de la competencia
El ajuste preestablecido determina la competencia en el motor de búsqueda Google por palabras clave
🔗 Extracción de los 3 primeros resultados
El ajuste preestablecido guarda los tres primeros fragmentos (snippets) de los resultados de búsqueda de Google
🔗 Preguntas y respuestas
Extractor que recopila preguntas y respuestas de la sección People Also Ask
Datos recopilados

- Enlaces, anclajes y fragmentos (snippets) de los resultados, así como la fecha del fragmento (si está disponible)
- También se recopila información sobre las etiquetas de cada resultado; actualmente se admiten etiquetas como: Date, AMP, Image Preview, Video, Rich snippet, Featured snippet
- Presencia y contenido de bloques publicitarios, así como su posición en la página
- Número de resultados por consulta (competencia)
- Lista de palabras clave relacionadas (Related keywords)
- Presencia de bloques adicionales en la página: carrusel de productos, videos, etc.
- El extractor también recopila estos datos adicionales:
- Presencia de errores tipográficos en la consulta y la consulta corregida
- Ubicación geográfica determinada por Google
- Presencia de páginas AMP
- Lista de "People also ask": preguntas, respuestas, enlaces a fuentes, sus anclajes y enlaces a medios (se activa con la opción separada Parse People also ask)
- Respuesta de IA (AI overview), su tipo y lista de fuentes

Características
El extractor del motor de búsqueda Google cuenta con múltiples capacidades y configuraciones:
- Soporte para todos los operadores de búsqueda de Google (site:, inurl:, etc.)
- Especificación del tamaño de los resultados (10, 20, 30, 50 o 100 resultados) y del número de páginas (de 1 a 10); con la configuración máxima, Google ofrece de 300 a 500 resultados por consulta, y gracias a la multiplicación de consultas, A-Parser supera fácilmente esta limitación
- Posibilidad de navegar automáticamente por palabras clave relacionadas
- Especificación del idioma y país de los resultados, opción de elegir el dominio local de Google, así como el idioma de la interfaz de búsqueda
- Posibilidad de especificar la geolocalización, lo que permite obtener resultados locales precisos para cualquier lugar del mundo
- Elección entre visualización de escritorio o móvil
- Posibilidad de elegir el tipo de resultados; además de la búsqueda orgánica principal, el extractor de Google puede recopilar resultados de noticias, libros o videos
- Si es necesario, se puede conectar el reconocimiento automático de ReCaptcha2 a través de servicios de resolución o mediante XEvil/CapMonster
- Admite la especificación del tiempo de los resultados (todo el tiempo o un intervalo específico desde 24 horas hasta un año)
- Posibilidad de desactivar el filtro de Google para ocultar resultados similares (filter=)
- Posibilidad de especificar si se deben extraer datos si Google informa que no se encontró nada para la consulta especificada y ofrece resultados para una consulta similar
- Posibilidad de definir la cantidad de People also ask que el extractor debe recopilar, haciendo clic en profundidad en cada pregunta
- Posibilidad de recopilar etiquetas
Los siguientes extractores funcionan basándose en el extractor de Google:
SE::Google::Position - determinación de posiciones de cualquier sitio en los resultados de búsqueda por una lista de consultas
SE::Google::Compromised - verifica la limpieza de los dominios desde el punto de vista de Google, puede identificar sitios pirateados y de phishing
SE::Google::TrustCheck - verifica el Trust (confianza) de Google hacia el sitio
Variantes de uso
- Recopilación de bases de enlaces para XRumer, AllSubmitter, GSA Ranker, etc.
- Volcado completo de las SERP, que incluye enlaces, anclajes, fragmentos, bloques publicitarios y otra información, permitiendo realizar un análisis profundo para especialistas SEO y profesionales del marketing
- Evaluación de la competencia para palabras clave
- Evaluación de la competencia en resultados de PPC (publicidad)
- Búsqueda de backlinks y menciones de sitios
- Verificación de la indexación de sitios
- Búsqueda de sitios vulnerables
- Cualquier otra variante que implique obtener resultados de búsqueda para un número ilimitado de consultas
Consultas
Como consultas, se deben indicar frases de búsqueda, exactamente igual a como se introducirían directamente en el formulario de búsqueda de Google, por ejemplo:
compra de auto
ventanas en madrid
site:https://lenta.ru
inurl:guestbook
Sustituciones de consultas
Puede utilizar macros integradas para multiplicar las consultas; por ejemplo, si queremos obtener una base de datos de foros muy grande, indicaremos varias consultas principales en diferentes idiomas:
forum
foro
foro
论坛
En el formato de consultas, indicaremos una iteración de caracteres de a a zzzz; este método permite rotar al máximo los resultados de búsqueda y obtener muchos resultados nuevos y únicos:
$query {az:a:zzzz}
Esta macro creará 475254 consultas adicionales por cada consulta de búsqueda inicial, lo que sumará 4 x 475254 = 1901016 consultas de búsqueda, una cifra impresionante, pero que no representa ningún problema para A-Parser. A una velocidad de 2000 consultas por minuto, esta tarea se procesará en solo 16 horas.
Uso de operadores
Puede utilizar operadores de búsqueda en el formato de consulta, de modo que se añadirán automáticamente a cada consulta de su lista:
inurl:$query
Variantes de salida de resultados
A-Parser admite un formateo flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados de forma personalizada, así como en formatos estructurados como CSV o JSON.
Exportación de lista de enlaces
Formato del resultado:
$serp.format('$link\n')
Ejemplo de resultado:
https://www.weforum.org/open-forum/
https://www.weforum.org/about/world-economic-forum/
https://www.merriam-webster.com/dictionary/forum
https://en.wikipedia.org/wiki/Forum
https://dictionary.cambridge.org/dictionary/english/forum
https://www.collinsdictionary.com/dictionary/english/forum
https://www.linkedin.com/company/world-economic-forum
https://docs.moodle.org/en/Forum_activity
https://wordpress.org/support/forums/
https://www.facebook.com/worldeconomicforum/
...
Enlaces + anclajes + fragmentos con posición
Formato del resultado:
[% FOREACH item IN serp; loop.count _ ' - ' _ item.link _ ' - ' _ item.anchor _ ' - ' _ item.snippet _ "\n"; END %]
Ejemplo de resultado:
1 - https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D1%83%D0%BC - Foro — Wikipedia - <em>Fórum</em> (lat. forum — arch. vestíbulo de una tumba; plataforma en un lagar para la uva a procesar; plaza de mercado, mercado de la ciudad; ...
2 - https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D1%83%D0%BC_(%D0%BC%D0%B5%D1%80%D0%BE%D0%BF%D1%80%D0%B8%D1%8F%D1%82%D0%B8%D0%B5) - Foro (evento) — Wikipedia - <em>Foro</em> — evento realizado para señalar o resolver problemas<wbr>suficientemente globales. Este concepto se encuentra en ...
3 - https://support.google.com/googleplay/community?hl=ru - Bienvenido al foro de ayuda de la comunidad ... - Bienvenido al foro de ayuda de <em>foro</em> la comunidad de Google Play. Entradas destacadas. Ver todas las entradas interesantes · ¿Necesita ayuda con un juego?
4 - https://support.google.com/mail/community?hl=en - Gmail Community - Google Support - Welcome to the Gmail Help Community · Featured posts · Categories.
5 - https://www.weforum.org/ - The World Economic Forum - The World Economic Forum is an independent international organization committed to improving the state of the world by engaging business, political, academic ...
6 - https://www.kunena.org/ - Home - Kunena - To Speak! Next Generation Forum ... - Kunena! - To Speak! Next Generation Forum Component for Joomla.
7 - https://forum.adguard.com/index.php - AdGuard Forum - <em>Foro</em> de probadores beta. Escribimos aquí informes sobre errores de versiones beta. Hilos: 355. Mensajes: 11.6K. Subforos: Comentarios a los lanzamientos de versiones beta ...
8 - https://www.sofiaforum.bg/ - Sofia Security Forum: Plataforma de discusión ... - Sofia <em>Foro</em> de Seguridad / Sofia Security Forum.
9 - https://forum.keenetic.net/ - Forums - Keenetic Community - Keenetic fan club. A place to meet software developers, get the latest updates, and share experience.
10 - https://forum.euroaion.com/ - Perfect quality European private server of Aion - EuroAion.com - Perfect quality European private server of Aion!
...
Salida de enlaces, anclajes y fragmentos en una tabla CSV
La utilidad integrada $tools.CSVLine permite crear documentos tabulares correctos, listos para importar en Excel o Google Sheets.
Formato general del resultado:
[% FOREACH i IN p1.serp; tools.CSVline(i.link, i.anchor, i.snippet); END %]
Nombre del archivo:
$datefile.format().csv
Texto inicial:
Enlace,Anclaje,Fragmento
Ejemplo de resultado:
Enlace,Anclaje,Fragmento
https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D1%83%D0%BC,"Foro — Wikipedia",
https://en.wikipedia.org/wiki/Forum,"Forum - Wikipedia","<em>Forum</em> (plural forums or fora) may refer to: Contents. 1 Common uses; 2 Places. 2.1 Natural features; 2.2 Populated places. 3 Arts and entertainment; 4 Media."
https://www.weforum.org/,"The World Economic Forum","The World Economic <em>Forum</em> is an independent international organization committed to improving the state of the world by engaging business, political, academic ..."
https://support.google.com/webmasters/community?hl=ru,"Bienvenido al foro de ayuda de la comunidad ...","Bienvenido al foro de ayuda de <em>foro</em> la comunidad del Centro de Búsqueda de Google. Entradas destacadas. Ver todas las entradas interesantes · Respuestas a ..."
https://support.google.com/chrome/community?hl=ru,"Bienvenido al foro de ayuda de la comunidad ...","Bienvenido al foro de ayuda de <em>foro</em> la comunidad de Google Chrome. Destacados ..."
...
En el Formato general de resultados se aplica el motor de plantillas Template Toolkit para mostrar el array $serp en un ciclo FOREACH.
En el nombre del archivo de resultados, simplemente debe cambiar la extensión del archivo a csv.
Para que la opción "Texto inicial" esté disponible en el Editor de tareas, debe activar "Más opciones". En "Texto inicial" escribimos los nombres de las columnas separados por comas y dejamos la segunda línea vacía.
Salida de bloques publicitarios
Formato del resultado:
$ads.format('$link - $anchor - $snippet\n')
Ejemplo de resultado:
https://www.rentalcars.com/ - Rent a Car Worldwide - Best Prices Online Guaranteed - Secure Your <em>Car Hire</em> Today. The Best Price Guaranteed. Book at Over 53,000 Locations. Search, Compare and Save Using the World's Biggest Online <em>Car Rental</em> Service.
https://www.kayak.com/United-States-Car-Rentals.253.crc.html - United States from $9/day - Search for Rental Cars on Kayak - Find and Compare Great <em>Car</em> Deals in USA. Book with Confidence on KAYAK®!
https://www.discovercars.com/ - -70% Worldwide Car Rental - Rent Your Car in 5 Minutes - <em>Car rental</em> prices are rising, but if you act fast, you can get a good deal. Don’t stress! We...
https://www.economybookings.com/ - Rent a Car for Summer Holidays - Car Rentals for the Best Price - Theft protection and Third Party liability part of a great deal. Free Mileage included.
...
Guardado de palabras clave relacionadas
Formato del resultado:
$related.format('$key\n')
Ejemplo de resultado:
test <b>speed</b>
<b>net speed</b> test
<b>google speed</b> test
<b>fast speed</b> test
<b>ping</b> test
<b>xfinity speed</b> test
<b>speed</b> test <b>mobile</b>
test <b>my</b>
...
Para eliminar automáticamente las etiquetas HTML en el resultado, debe utilizar el Constructor de resultados, seleccionar el array $related y aplicar Remove HTML tags.
Competencia de palabras clave
Formato del resultado:
$query - $totalcount\n
Ejemplo de resultado:
speed test mobile - 1080000000
test score - 4020000000
net speed test - 1210000000
fast speed test - 2150000000
speed test - 2500000000
test match - 4160000000
ping test - 425000000
google speed test - 1870000000
Determinación de palabras clave con errores
Formato del resultado:
$query - $misspell\n
Ejemplo de resultado:
spead test - 1
test match - 0
speed test - 0
temst match - 1
Verificación de indexación de enlaces
Formato de consulta:
site:$query
Formato del resultado:
$query.orig - $totalcount\n
Ejemplo de resultado:
https://a-parser.com/pages/buy - 2
https://a-parser.com/wiki/parsers - 4
https://a-parser.com/resources - 883
https://trjkjfkdf.bg.ky - none
https://a-parser.com/forum - 371
Para verificar la indexación de enlaces, insertamos el operador correspondiente en el Formato de consulta: site:.
El formato del resultado se muestra como "url original - cantidad de páginas en el índice".
Como resultado, obtenemos la dirección de las páginas y su cantidad en el índice del buscador.
Si la página no está presente, el resultado será: none.
Guardado en formato SQL
Formato del resultado:
[% FOREACH serp; "INSERT INTO serp VALUES('" _ query _ "', '"; link _ "', '"; anchor _ "')\n"; END %]
Ejemplo de resultado:
INSERT INTO serp VALUES('test', 'https://www.speedtest.net/', 'Speedtest by Ookla - The Global Broadband Speed Test')
INSERT INTO serp VALUES('test', 'https://fast.com/', 'Fast.com: Internet Speed Test')
INSERT INTO serp VALUES('test', 'https://www.business-standard.com/article/sports/ind-vs-aus-live-score-4th-day-5-india-vs-australia-live-cricket-score-online-brisbane-weather-121011900103_1.html', 'IND vs AUS 4th Test highlights: India creates history, wins ...')
INSERT INTO serp VALUES('test', 'https://www.test.com/', 'Find online tests, practice test, and test creation software | Test ...')
INSERT INTO serp VALUES('test', 'https://www.espncricinfo.com/series/india-in-australia-2020-21-1223867/australia-vs-india-4th-test-1223872/match-report-4', 'Recent Match Report - Australia vs India 4th Test 2020 ...')
INSERT INTO serp VALUES('test', 'https://www.icc-cricket.com/world-test-championship/standings', 'World Test Championship (2019-2021) Points Table - Live ...')
INSERT INTO serp VALUES('test', 'https://www.icc-cricket.com/rankings/mens/team-rankings/test', 'ICC Test Match Team Rankings International Cricket Council')
INSERT INTO serp VALUES('test', 'https://projectstream.google.com/speedtest', 'Speedtest - Google')
INSERT INTO serp VALUES('test', 'https://www.google.com/search?hl=en&q=Software+Testing&stick=H4sIAAAAAAAAAONgecQ4g5Fb4OWPe8JSfYyT1py8xtjOyMUVnJFf7ppXkllSKaTCxQZlSXHxSHHo5-obmJul5GkwSHFxwXlKwUbuuy5NO8fmKMgABGJm_g5SmlpCXOyexT75yYk5ggpvuB68mfLeXkuYiyMksSI_Lz-3UtCBgcHhx__39kqcnEBND7aoddhrMTTtW3GIjYWDUYCBZxGrQHB-Wkl5YlGqQkhqcUlmXjoAS5B1P7EAAAA&sa=X&ved=2ahUKEwiW-rnmlajuAhWpAGMBHR-JAv4Q6RMwHXoECDQQBQ', '')
...
Volcado de resultados en JSON
Formato general del resultado:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.totalcount = p1.totalcount;
obj.links = [];
FOREACH item IN p1.serp;
obj.links.push(item.link);
END;
obj.json %]
Texto inicial:
[
Texto final:
]
Ejemplo de resultado:
[{"totalcount":"6450000000","links":["https://www.speedtest.net/","https://fast.com/","https://projectstream.google.com/speedtest","https://www.test.com/","https://www.speakeasy.net/speedtest/","https://www.att.com/support/speedtest/","https://speedtest.xfinity.com/","https://developers.google.com/speed/pagespeed/insights/","https://www.espncricinfo.com/series/india-in-australia-2020-21-1223867/australia-vs-india-4th-test-1223872/match-report-4","https://nasional.tempo.co/read/1424570/listyo-sigit-temui-ahy-menjelang-fit-and-profer-test-calon-kapolri","https://www.google.com/search?hl=en&q=Test+Assessment&stick=H4sIAAAAAAAAAONgecRYyC3w8sc9YamMSWtOXmNM4uIKzsgvd80rySypFNLiYoOyFLj4pbj10_UNjQyzKsvyzDQYpHi5kAWUNIxkdl2ado5NTJABCMTKAhyUODmBLIVA-wX2WgxN-1YcYmPhYBRg4FnEyh-SWlyi4FhcnFpcnJuaVwIAwEAP9ogAAAA&sa=X&ved=2ahUKEwj17MzXmajuAhW8CWMBHRlzBP4Q6RMwDHoECBEQBQ"]}]
Para que las opciones "Texto inicial" y "Texto final" estén disponibles en el Editor de tareas, debe activar "Más opciones".
Procesamiento de resultados
A-Parser permite procesar los resultados directamente durante la extracción; en esta sección presentamos los casos más populares para el extractor de Google.
Unicidad de enlaces
Añadir unicidad y en la lista desplegable seleccionar $serp.$i.link - Link.
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJx9VE1v2zAM/SsFkcMGBEFy2MW3NFiKDVnTNekpyEGNaUOLLGmSnDUw/N9H+ktO
N/Rmko+PfCTlCoLwZ//k0GPwkBwqsM03JLD7miQPxuQK7zZSn/3di5a/S4QpWOE8
OoYfRigKpJiJUgWYVhCuFonEXNA5mXJQpmRbZ96uDoOT6Ml3Eapk2GI+n0P9QZrI
8WRKHWLO4gO44n4tOk4bZcxHKWUvhuRyy8kBSJMlByfDcdoh9i3cU8c6h977oMyr
UJAEV2J9PPYsfm1cIXh4E7uYdZMcgjtxwb2hYCZVrOzXZD2KgqtMUhGQo7OsIfr0
eRbemEGkqQzSaKHaCjz7WLVbTALaEJY+ebprZwpyBWwI2HntuzvApLGjyp9tDiSZ
UB6n4KnVtaBG0vcRGdCJYNzWcj/kr8DopVIbvKCKsIb/vpQqpUNZZpT0rUv8P2T7
D0c9yBuXokX/cdTDwNJY99sfMSs1G5OT8vS1WWYhA9l+1VxPAnNynhHtMLNHnllh
HA5lOuauOr0Ni5qvKq5saaPrRsbNWm6dJ6MzmW+7S+2Rpd7TA9zqlSmsQtalS6Vo
LR6f43ksfbcGNmKD75NXTQmW3r9DCMYo/33XtmqdpPP7wg0WNMlx1Y7yJJR6ed6M
IxBPqjknz7QnutPc0AWRivo4/BGG/0g1/i8kVU1r+eWfWhBrYAj5aBieZs6P+S/t
6pW4
Ver también: Unicidad de resultados
Unicidad de enlaces por dominio
Añadir unicidad y en la lista desplegable seleccionar $serp.$i.link - Link. Seleccionar el tipo de unicidad: Dominio.
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJx9VE2P2jAQ/SvI4tBKaAWHXnJj6bJqRZftwp4QB0MmyMXxuLZDF0X89844IQ7b
am+ZmffefDq1CNIf/bMDD8GLbFMLG79FJlYPWfaIeNAwWChz9INXo35XMNidB1+x
lMqIkbDSeXBM3PTwFMihkJUOYlSLcLZAcngC51TOQZWTbR2+nR0Ep8CT7yR1xbDJ
eDwWlw9o8gB7rExInMkHcM2VW3BM6zHGPUoV26IgNc4lZxtBPVlyMFlsRy1i3cDz
a++N91HjTmqRBVfBZbu9qvg5ulLyGId2ctfOtAuu5AnWSMFC6ZTZz8l6kiVnGeYy
AEfviij06fNdeGMFmecqKDRSNxl49ilrsyLiGyQsffJ05w5LcgWIAuw8X6vbiGG0
U5c/G47ICqk9jISnUueSCsnfR1QAJwO6peV6yF8LNFOtF3ACnWBR/75SOqdDmRZE
+tYS/w9Z/qNx6drrp6JF/3FUQ6cSrfvlj8TKcYEHXtkuLrNUgWw/i9eTiTE5jwC2
m9kTz6xEB12aVrnNTq/EguGrSiub2uS6aeNmLbfOPZpCHZbtpV6RlVnTU1yaGZZW
A/dlKq1pLR5e0nlMfbsGNlKB78mzmIJbv75DERC1/75qSrVO0fl94QJLmmQ/ayu5
l1q/viz6EZFOKp6TZ9k93ekB6YKoi8u2+yN0f5S6/1/I6gut5Zd/bkDcA0PIR8Pw
NHN+zH8BRVyZDA==
Ver también: Unicidad de resultados
Extracción de dominios
Añadir Results Builder (Constructor de resultados) y en la lista desplegable seleccionar la fuente: $p1.serp.$i.link - Link. Seleccionar el tipo: Extract Domain.
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJx9VE1v2zAM/SuFkMMGBIFz2MW3NGuGDVnTNe0p6EGzaUOLLGqSnCUw8t9HKort
dkNv5scj+cgndyJIv/cPDjwEL/JdJ2z8FrnY3uX5F8Raw83dMThZhJvP2EhlxFRY
6Tw4BuxGeRQooZKtDmLaiXCyQGXwAM6pkoOqJNs6PJ4cBKfAk+8gdctp8yzLxPkd
mKyhwNaEATN/J10rs/cWHMNGiOz88jIVxJBm9Ct0jWSmEzufJdp9cCsP8IQUrFQk
dsWQdS8bbjkpZQCOzqpY6MPHWThyBVmWKig0Ul868JqGrs9G/Y6MDVIuffIiVg4b
cgWIBdh5uk63E5NoCyrRRuyPC0bkldQepsLTqCtJg5RvIyqAkwHdxvI85O8EmoXW
aziAHtJi/dtW6ZJuuqgI9DUB/5+y+afGuac3bkU3+eNohr5KtG433wdUiWusiXn5
k3hr1ahAtl/GQ+ciI+cewPY7u+edNeigb5Mqp+4kZAuGBTCcbGEH1ysar84ycnbC
Y+sK6rfLpjtBQrdxOLMXrJ6kOLi8if5JSOfkifwpPWBSoTgTpkBTqXqTRHrt3Jon
en0bs8TGauA9mVZrOrOHx0FuC5/OysZA+C14GVvwKq9PkGZA7b9tL9StUzTSJybc
0GXGXVPJQmr9/LgeR8Qg0ShPz2UL0n2NpEhiweTSz6D/iXTjX0LenenMv/zDJYk5
cAr5aBmebsjv+C86oZM/
Ver también: Constructor de resultados
Eliminación de etiquetas de anclajes y fragmentos
Añadir Results Builder (Constructor de resultados) y en la lista desplegable seleccionar la fuente: $p1.serp.$i.anchor - Anchor. Seleccionar el tipo: Remove HTML tags.
Añadir de nuevo el Results Builder (Constructor de resultados) y en la lista desplegable seleccionar la fuente: $p1.serp.$i.snippet - Snippet. Seleccionar el tipo: Remove HTML tags.
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJyVVD1v2zAQ/SsC4aEFBEMeumhzjLpp4cSp7UxGBlY6qawpkiUpN4bg/947mpaU
NAjQjby79+7rkR3z3B3cgwUH3rF83zETzixn2895/kXrWkKygUYfIbnd3a0Sz2uX
VFY3yVwVP7V1CVdlslXCGKJImeHWgSWy/YgDHSVUvJWepR3zJwOYAkmtFSU5RYl3
Y/XzyYK3AojpyGVLYbMsy9j5HRivodCt8gNm9k64FOrgDFiCjRDZ+ekpZdg91uiW
2jacpjAxs2kcSe/c8iPsNDorERq7YvB2zxtKOSm5B/JOq0D04ePUPxMDL0vhhVZc
XjLQmIasj0r8Dh0rjbF4pEEscdZo8hAIyHi6Vrdnk3BnSNEG7PcLhuUVlw5S5rDU
JcdCytce4cFyr+3aUD1o75hWcylXcAQ5hAX+m1bIEnc6rxD0NQLfDln/w3Hu2xun
wp38sVhDzxJuN+u7AVXqla6x8/IH9i1FIzze3SIsOmcZGg8App/ZPc2s0Rb6NJE5
ZkeRG1AkgGFlczOYXrTxYi0jY8ecbm2B+fZZumcodENbDS+BkX6i5mx4Mbe+keS2
lp/QGKM9SSdCSKZvMbrLe/ovyivmjJhCq0rU66j8azut2uFzX6uFbowEGr5qpUTt
ONgMGp67qBW6DFN8DV6EFLSf67vGMrR037aXeRorsKpPaSx8nDVSFlzKx81q7GGD
7oPmHdEW+JhqjTLHLqi5+MP0v1Y3/mfy7oza+eUeLkHUA4WgDYfhUBj0OfwFH/O5
UQ==
El constructor de resultados se puede añadir tantas veces como necesite.
Ver también: Constructor de resultados
Filtrado de enlaces por inclusión
Añadir filtro y en la lista desplegable seleccionar: $serp.$i.link - Link. Seleccionar el tipo: Contiene cadena. Luego, en String (Cadena), escriba el criterio de filtrado.
Descargar ejemplo
Cómo importar un ejemplo en A-Parser
eJx9VE1v2kAQ/StoxSGVEIJDL74RVKpWNKSBnBCHDR5bG9Y72901DbL83zuzNrZJ
qtw8H+/Nm491JYL0J//owEPwItlXwsZvkYjttyT5jphrGK2UDuCUyUcvl5EP8UuZ
kVbmJCbCSufBMXo/AFEghUyWOohJJcLFAnHiGZxTKQdVSrZ1+HZxQIzgyXeWuuS0
+Ww2E/UnMJnDEUsTesz8k3TW6S04hg0QswEkix1SkLpnycleUE+WHLHJw6TN2DXp
RzRBKjOQPD1iQSbaoNCQ7cF4UR8OV0a/QldInuvYzqftkLvgVp5hh40O6N00d3iQ
BfOPUxmAo9MsEt19mYY3ZpBpqrim1E0F3kNf9dmoP1GfQcqlT570ypHWRASIBOy8
XNXtxTja3HEZsb8bjEgyqT1MhCepK0lC0vcRRfORAd0mzoD8lUCz0HoNZ9B9WuS/
L5VO6WgWGYF+tMD/p2w+cNRde8NStPS/jjR0LNG63/zqUSmuMafO05e42EIFsv0y
XlIiZuQ8AdhuZg88swIddGVa5rY6PRsLhi+sX9nC9q6bNm7Wcuuka8pUvmmv9ppZ
mh29zY1ZYmE1cF+m1JrW4uGpP4+Fb9fARi/wPXgZS3Dr1zcpAqL2P7eNVOsUnd9X
FljQJIdVW8qj1Pr5aT2MiP6k4jl5pj3SneZIF0Rd1Ifu79D9YqrhPyKpalrLq39s
krgHTiEfDcPHlzSv/wHtZp3U
Ver también: Filtros de resultados
Posibles configuraciones
Parámetros regionales
Google domain - dominio de Google utilizado, por defecto google.com
Results language - búsqueda de páginas en el idioma seleccionado; en el navegador esto corresponde a la opción Búsqueda avanzada -> Configuración adicional -> Buscar en (parámetro url lr). Por defecto no está definido, lo que significa detección automática basada en la IP.
Spoiler: Captura de pantalla

Interface language - idioma de los productos de Google; en el navegador esto es Idiomas -> Idioma de la interfaz (parámetro url hl). Por defecto está seleccionado el idioma inglés.
Spoiler: Captura de pantalla

Search from country - selección de la región de búsqueda; en el navegador esto es Idiomas -> Región de búsqueda (parámetro url gl). Por defecto no está definido, lo que significa detección automática basada en la IP.
Spoiler: Captura de pantalla

Narrow results by region - búsqueda de páginas creadas en un país específico; en el navegador esto es Búsqueda avanzada -> Configuración adicional -> País (parámetro url cr). Por defecto no está definido, lo que significa que esta opción está desactivada.
Spoiler: Captura de pantalla

Location (city) - ubicación exacta de la búsqueda; en el navegador se determina automáticamente según la ubicación del usuario. Por defecto no está definido, lo que significa detección automática basada en la IP de la consulta.
Spoiler: Captura de pantalla

Todos los parámetros regionales influyen en mayor o menor medida en los resultados.
| Nombre del parámetro | Valor por defecto | Descripción |
|---|---|---|
| Device | Desktop | Selección de resultados de escritorio o móviles: Desktop / Mobile |
| Pages count | 5 | Cantidad de páginas para extraer (de 1 a 100) |
| Serp type | Default (All) | Determina si se extrae de la página principal, por noticias o blogs (Books, News, Videos) |
| Hide omitted results | ☑ | Determina si se deben ocultar los resultados omitidos (parámetro filter=) |
| Serp time | Anytime | Tiempo de la SERP (búsqueda dependiente del tiempo, parámetro tbs=, valores posibles: Past 1 hour, Past 24 hours, Past week, Past month, Past year) |
| Parse not found | ☑ | Determina si se deben extraer datos si Google informa que no se encontró nada para la consulta especificada y ofrece resultados para otra consulta |
| Disable autocorrect | ☐ | Permite desactivar la autocorrección de Google y extraer resultados exactamente para la consulta especificada |
| Exact match | ☐ | Corresponde a la opción "Coincidencia exacta" en el buscador. Atención, esta opción sobrescribe el valor del parámetro Serp time (similar al funcionamiento de estas opciones en el navegador). |
| Safe search | Blur | Posibilidad de activar la "Búsqueda segura" |
| Google domain | www.google.com | Dominio de Google para la extracción; se admiten todos los dominios (www.google.ac, www.google.com.af, www.google.co.ck, etc.) |
| Narrow results by region | Any region | Posibilidad de restringir la búsqueda a un país específico |
| Results language | Auto (Based on IP) | Selección del idioma de los resultados (parámetro lr=) |
| Search from country | Auto (Based on IP) | Selección del país desde donde se realiza la búsqueda (búsqueda geodependiente, parámetro gl=) |
| Interface language | English | Posibilidad de elegir el idioma de la interfaz de Google, para una máxima identidad de los resultados entre el extractor y el navegador |
| Location (city) | Búsqueda por ciudad, región. Se pueden indicar ciudades como novosibirsk, russia; la lista completa de ubicaciones se encuentra en Geotargets (copia - debe usarse el valor de la columna Canonical Name). También es necesario establecer el dominio de Google correcto | |
| Util::ReCaptcha2 preset | default | Determina si se debe usar Util::ReCaptcha2 para evadir recaptchas |
| Util::AntiGate preset | default | Determina si se debe usar Util::AntiGate para evadir captchas gráficos |
| ReCaptcha2 retries | 3 | Cantidad de intentos de envío de respuesta de recaptcha el número de veces especificado, sin cambiar el proxy |
| ReCaptcha2 pass proxy | ☐ | Permite pasar el proxy (usado en la consulta a Google) y las cookies (obtenidas en la respuesta de Google) al servicio de reconocimiento de ReCaptcha |
| Use sessions | ☑ | Guarda sesiones buenas, lo que permite extraer aún más rápido, obteniendo un menor número de errores. |
| Don't take session | ☐ | Posibilidad de no utilizar las sesiones buenas guardadas |
| Additional headers | Permite especificar cualquier encabezado propio | |
| PAA questions count | 0 | Cantidad máxima de preguntas y respuestas (People also ask) por cada consulta que el extractor debe recopilar |
| Empty totalcount is error | ☐ | Al activar este parámetro, la consulta se considerará fallida si falta el valor de $totalcount, y en consecuencia se realizarán intentos repetidos |
| Redirect browser max pages | 10 | Cantidad de páginas del navegador utilizadas para evadir la protección en forma de verificación de JavaScript activado |
| Single redirect browser for task | ☑ | Si en la tarea se especifican varios extractores de Google, utilizar solo un navegador para todas las subtareas; el número máximo de páginas y el resto de configuraciones se toman del primer extractor de Google en la tarea |

