FreeAI::GoogleAI - Extractor de Google AI mode

Descripción general del extractor
El extractor Google AI mode es una potente herramienta para recopilar información estructurada de uno de los sistemas de IA líderes, ya que el modo AI funciona sobre la base de Gemini de Google. Gracias a la integración con Google AI mode, usted obtiene no solo listas de enlaces, sino respuestas actualizadas, concisas y relevantes basadas en una gran cantidad de fuentes, incluyendo artículos científicos, blogs, foros y portales de noticias.
El extractor Google AI mode admite consultas en lenguaje natural, incluyendo aclaraciones, preguntas contextuales y construcciones anidadas. La velocidad de procesamiento alcanza los 800–1500 consultas por minuto gracias al modo de funcionamiento multihilo. Dependiendo de la configuración y de los ajustes preestablecidos utilizados, puede obtener decenas de miles de fragmentos de texto únicos y cientos de enlaces en pocos minutos.
Los resultados de la entrega se pueden guardar en cualquier formato necesario gracias al potente motor de plantillas Template Toolkit, que permite estructurar los datos en JSON, CSV, SQL y otros formatos, así como aplicar filtrado, ordenación y agregación de datos sobre la marcha.
El extractor FreeAI::GoogleAI es ideal para tareas de inteligencia competitiva, recopilación de hechos y citas, creación de bases de conocimientos, monitoreo de noticias y análisis de temas, gracias a la alta calidad y contextualidad de los resultados entregados.
Actualmente, Google proporciona acceso al modo AI solo en el territorio de EE. UU., por lo que para el funcionamiento del extractor es necesario utilizar proxies de US. También por la misma razón, los resultados están solo en inglés.
Datos recopilados
- Texto de la respuesta (en formato HTML)
- Enlaces, anclas y fragmentos (snippets) de las fuentes de datos
Posibilidades
- Al igual que el extractor SE::Google, se admite la omisión de la verificación de JS y el trabajo con reCAPTCHA
- Soporte de sesiones para un funcionamiento más estable y rápido
Casos de uso
- Recopilación de respuestas estructuradas por consultas temáticas para crear bases de conocimientos, planes de contenido, sistemas de referencia y generación de FAQ
- Extracción de enlaces a fuentes con anclas y fragmentos: ideal para construir listas de recursos de autoridad, citación y recopilación de enlaces de retroceso
- Monitoreo de menciones de marcas, productos o personas, vinculado al contexto y a las fuentes
- Búsqueda y análisis de opiniones de expertos, tendencias e ideas de fuentes autorizadas
- Verificación rápida de la actualidad y completitud de la información sobre temas clave
- Automatización del análisis de la competencia: qué recursos se citan, qué temas se cubren y con qué frecuencia
- Soporte para proyectos de investigación y análisis que requieren la agregación de información precisa de diferentes fuentes
- Cualquier otra tarea donde se requiera obtener rápidamente respuestas breves y precisas con confirmación de fuentes reales y contexto lógico
Consultas
Como consultas, es necesario indicar términos de búsqueda, exactamente igual que si se introdujeran directamente en el formulario de búsqueda de Google AI mode, por ejemplo:
How to learn fast?
How to improve memory and concentration?
What is a parser?
Resultados
Aquí y en adelante, los ejemplos de resultados se han abreviado para una mejor claridad
Por defecto, se muestra la respuesta a la consulta, por ejemplo:
A parser is a program that <b>analyzes input data, typically text or code, and converts it into a structured format that a computer can understand and process</b>.<br />
<b>Here's a breakdown of what a parser does:</b>
<ul>
<li><b>Takes Input:</b> Parsers receive input, which can be source code, data in a specific format (like XML or JSON), interactive commands, etc.</li>
<li><b>Breaks Down Input:</b> The parser breaks the input into its constituent parts, such as keywords, operators, identifiers, and symbols, which are called tokens.</li>
...
To improve memory and concentration, you can implement a combination of lifestyle changes and cognitive exercises.<br />
<b>Lifestyle Changes:</b>
<ul>
<li><b>Prioritize Sleep:</b> Adequate and quality sleep is crucial for memory consolidation and cognitive function. Aim for 7-9 hours of sleep each night and maintain a consistent sleep schedule.</li>
...
To learn fast and retain information effectively, focus on strategies that promote active engagement, optimize brain function, and utilize science-backed learning techniques.<br />
<b>1. Enhance Cognitive Function and Focus:</b>
<ul>
<li><b>Prioritize Sleep:</b> Quality sleep is crucial for memory consolidation and improved concentration. Aim for 7-9 hours of sleep per night for optimal results.</li>
...
Opciones de salida de resultados
A-Parser admite un formateo flexible de resultados gracias al motor de plantillas integrado Template Toolkit, lo que le permite mostrar los resultados en forma arbitraria, así como estructurada, por ejemplo CSV o JSON.
Exportación de lista de enlaces
Formato del resultado:
$links.format('$link\n')
Ejemplo de resultado:
https://www.techtarget.com/searchapparchitecture/definition/parser
https://www.linkedin.com/advice/3/what-role-parser-programming-language-theory-bxxbe#:~:text=A%20parser%20in%20a%20compiler,the%20compilation%20process%20will%20stop.
https://www.huntress.com/cybersecurity-101/topics/what-is-a-parser
https://botpenguin.com/glossary/syntax-analysis
https://www.dremio.com/wiki/parsing/#:~:text=Parsing%2C%20also%20known%20as%20syntax,%2C%20processed%2C%20or%20analyzed%20effectively.
...
Salida en CSV de enlaces, anclas y fragmentos con sus posiciones
Formato del resultado:
[% FOREACH item IN links; tools.CSVline(loop.count, item.link, item.anchor, item.snippet); END %]
Ejemplo de resultado:
...
8,https://www.howtolearn.com/2021/01/9-science-backed-ways-to-learn-anything-faster/,"9 Science Backed Ways to Learn Anything Faster - HowToLearn.com","Jan 4, 2021 — Table of Contents * Break Your Learning into Manageable Portions. * Review What You're Learning Frequently. * Use Mindmaps to Summarize Information. * Take Note..."
9,https://www.linkedin.com/pulse/how-slow-learners-easily-speed-up-learning-sathya-molagoda,"How Slow Learners Easily Speed Up Learning - LinkedIn","Dec 24, 2022 — How Slow Learners Easily Speed Up Learning * Introduction. If you are a slow learner, don't worry. You can easily speed up your learning by using some tips and ..."
10,https://www.linkedin.com/pulse/5-science-backed-learning-techniques-save-time-supercharge-k-c-barr-ljqee,"5 Science-Backed Learning Techniques That Save Time and ...","Jan 16, 2025 — Offsetting forgetting is like patching those holes to retain as much water as possible. * 5 Actionable Steps: Review new material within 24 hours of learning it..."
1,https://www.huntress.com/cybersecurity-101/topics/what-is-a-parser,"What Is a Parser? A Beginner-Friendly Guide to ... - Huntress","May 27, 2025 — What's a Parser (And Why Should You Care)? ... Ever wondered what happens behind the scenes when computers process text, code, or data? That's where parsers com..."
2,https://www.huntress.com/cybersecurity-101/topics/what-is-a-parser,"What Is a Parser? A Beginner-Friendly Guide to ... - Huntress","May 27, 2025 — What's a Parser (And Why Should You Care)? ... Ever wondered what happens behind the scenes when computers process text, code, or data? That's where parsers com..."
3,"https://www.techtarget.com/searchapparchitecture/definition/parser#:~:text=In%20computer%20technology%2C%20a%20parser,necessary%20input%20has%20been%20provided.","What is a Parser? Definition, Types and Examples - TechTarget","Jul 7, 2022 — What is a parser? In computer technology, a parser is a program that's usually part of a compiler. It receives input in the form of sequential source program in..."
En el Formato general de resultados se aplica el motor de plantillas Template Toolkit para mostrar el array $links en un ciclo FOREACH.
En el nombre del archivo de resultados, simplemente debe cambiar la extensión del archivo a csv.
Configuraciones posibles
| Nombre del parámetro | Valor por defecto | Descripción |
|---|---|---|
| Results language | Auto (Based on IP) | Selección del idioma de los resultados (parámetro lr=) |
| Search from country | Auto (Based on IP) | Selección del país desde donde se realiza la búsqueda (búsqueda geo-dependiente, parámetro gl=) |
| Location (city) | Búsqueda por ciudad, región. Se pueden indicar ciudades en forma de novosibirsk, russia; la lista completa de ubicaciones se puede encontrar en Geotargets (copia - se debe usar el valor de la columna Canonical Name). También es necesario establecer el dominio de Google correcto | |
| Util::ReCaptcha2 preset | default | Determina si usar Util::ReCaptcha2 para omitir reCAPTCHA |
| Util::AntiGate preset | default | Determina si usar Util::AntiGate para omitir captchas gráficos |
| ReCaptcha2 retries | 3 | Número de intentos de envío de respuesta por reCAPTCHA la cantidad de veces indicada, sin cambiar el proxy |
| ReCaptcha2 pass proxy | ☐ | Permite pasar el proxy (utilizado en la consulta a Google) y las cookies (obtenidas en la respuesta de Google) al servicio de reconocimiento de ReCaptcha |
| Use sessions | ☑ | Guarda sesiones buenas, lo que permite extraer datos aún más rápido, obteniendo un menor número de errores. |
| Don't take session | ☐ | Posibilidad de no utilizar sesiones buenas guardadas |
| Additional headers | Permite indicar cualquier encabezado propio | |
| Redirect browser max pages | 10 | Número de páginas del navegador utilizadas para omitir la protección en forma de verificación de JavaScript habilitado |

