Vai al contenuto principale

FreeAI::GoogleAI - Scraper Google AI mode

GoogleAI

Panoramica dello scraper

Lo scraper Google AI mode è un potente strumento per la raccolta di informazioni strutturate da uno dei principali sistemi di IA, poiché la modalità AI si basa su Gemini di Google. Grazie all'integrazione con Google AI mode, non otterrai solo elenchi di link, ma risposte aggiornate, concise e pertinenti basate su una vasta gamma di fonti, tra cui articoli scientifici, blog, forum e portali di notizie.

Lo scraper Google AI mode supporta query in linguaggio naturale, inclusi chiarimenti, domande contestuali e strutture nidificate. La velocità di elaborazione raggiunge 800–1500 query al minuto grazie alla modalità di lavoro multithreading. A seconda della configurazione e dei preset utilizzati, è possibile ottenere decine di migliaia di frammenti di testo unici e centinaia di link in pochi minuti.

I risultati possono essere salvati in qualsiasi formato desiderato grazie al potente motore di modelli Template Toolkit, che consente di strutturare i dati in JSON, CSV, SQL e altri formati, oltre ad applicare filtri, ordinamento e aggregazione dei dati al volo.

Lo scraper FreeAI::GoogleAI è ideale per compiti di competitive intelligence, raccolta di fatti e citazioni, creazione di basi di conoscenza, monitoraggio delle notizie e analisi dei temi, grazie all'alta qualità e contestualità dei risultati forniti.

informazione

Al momento, Google fornisce l'accesso alla modalità AI solo nel territorio degli Stati Uniti, pertanto per il funzionamento dello scraper è necessario utilizzare proxy US. Inoltre, per lo stesso motivo, i risultati sono solo in lingua inglese.

Dati raccolti

  • Testo della risposta (in formattazione HTML)
  • Link, anchor e snippet delle fonti dei dati

Funzionalità

  • Analogamente allo scraper SE::Google, è supportato l'aggiramento del controllo JS e il lavoro con ReCaptcha
  • Supporto per le sessioni per un funzionamento più stabile e veloce

Casi d'uso

  • Raccolta di risposte strutturate per query tematiche per la creazione di basi di conoscenza, piani editoriali, sistemi di riferimento e generazione di FAQ
  • Estrazione di link alle fonti con anchor e snippet - ideale per la costruzione di elenchi di risorse autorevoli, citazioni e raccolta di backlink
  • Monitoraggio delle menzioni di brand, prodotti o persone - con riferimento al contesto e alle fonti
  • Ricerca e analisi di opinioni di esperti, trend e insight da fonti autorevoli
  • Verifica rapida dell'attualità e della completezza delle informazioni su temi chiave
  • Automazione dell'analisi dei competitor: quali risorse vengono citate, quali temi vengono trattati e con quale frequenza
  • Supporto per progetti di ricerca e analisi che richiedono l'aggregazione di informazioni precise da diverse fonti
  • Qualsiasi altro compito in cui sia necessario ottenere rapidamente risposte brevi e precise con conferma da fonti reali e contesto logico

Query

Come query, è necessario indicare le query di ricerca esattamente come se venissero inserite direttamente nel modulo di ricerca di Google AI mode, ad esempio:

How to learn fast?
How to improve memory and concentration?
What is a parser?

Risultati

informazione

Qui e di seguito gli esempi dei risultati sono abbreviati per una migliore chiarezza

Per impostazione predefinita viene visualizzata la risposta alla query, ad esempio:

A parser is a program that <b>analyzes input data, typically text or code, and converts it into a structured format that a computer can understand and process</b>.<br />
<b>Here&#39;s a breakdown of what a parser does:</b>
<ul>
<li><b>Takes Input:</b> Parsers receive input, which can be source code, data in a specific format (like XML or JSON), interactive commands, etc.</li>
<li><b>Breaks Down Input:</b> The parser breaks the input into its constituent parts, such as keywords, operators, identifiers, and symbols, which are called tokens.</li>
...
To improve memory and concentration, you can implement a combination of lifestyle changes and cognitive exercises.<br />
<b>Lifestyle Changes:</b>
<ul>
<li><b>Prioritize Sleep:</b> Adequate and quality sleep is crucial for memory consolidation and cognitive function. Aim for 7-9 hours of sleep each night and maintain a consistent sleep schedule.</li>
...
To learn fast and retain information effectively, focus on strategies that promote active engagement, optimize brain function, and utilize science-backed learning techniques.<br />
<b>1. Enhance Cognitive Function and Focus:</b>
<ul>
<li><b>Prioritize Sleep:</b> Quality sleep is crucial for memory consolidation and improved concentration. Aim for 7-9 hours of sleep per night for optimal results.</li>
...

Esempi di output dei risultati

A-Parser supporta la formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma arbitraria, così come in forma strutturata, ad esempio CSV o JSON.

Esportazione dell'elenco dei link

Formato del risultato:

$links.format('$link\n')

Esempio di risultato:

https://www.techtarget.com/searchapparchitecture/definition/parser
https://www.linkedin.com/advice/3/what-role-parser-programming-language-theory-bxxbe#:~:text=A%20parser%20in%20a%20compiler,the%20compilation%20process%20will%20stop.
https://www.huntress.com/cybersecurity-101/topics/what-is-a-parser
https://botpenguin.com/glossary/syntax-analysis
https://www.dremio.com/wiki/parsing/#:~:text=Parsing%2C%20also%20known%20as%20syntax,%2C%20processed%2C%20or%20analyzed%20effectively.
...

Output in CSV di link, anchor e snippet con le loro posizioni

Formato del risultato:

[% FOREACH item IN links; tools.CSVline(loop.count, item.link, item.anchor, item.snippet); END %]

Esempio di risultato:

...
8,https://www.howtolearn.com/2021/01/9-science-backed-ways-to-learn-anything-faster/,"9 Science Backed Ways to Learn Anything Faster - HowToLearn.com","Jan 4, 2021 — Table of Contents * Break Your Learning into Manageable Portions. * Review What You&#39;re Learning Frequently. * Use Mindmaps to Summarize Information. * Take Note..."
9,https://www.linkedin.com/pulse/how-slow-learners-easily-speed-up-learning-sathya-molagoda,"How Slow Learners Easily Speed Up Learning - LinkedIn","Dec 24, 2022 — How Slow Learners Easily Speed Up Learning * Introduction. If you are a slow learner, don&#39;t worry. You can easily speed up your learning by using some tips and ..."
10,https://www.linkedin.com/pulse/5-science-backed-learning-techniques-save-time-supercharge-k-c-barr-ljqee,"5 Science-Backed Learning Techniques That Save Time and ...","Jan 16, 2025 — Offsetting forgetting is like patching those holes to retain as much water as possible. * 5 Actionable Steps: Review new material within 24 hours of learning it..."
1,https://www.huntress.com/cybersecurity-101/topics/what-is-a-parser,"What Is a Parser? A Beginner-Friendly Guide to ... - Huntress","May 27, 2025 — What&#39;s a Parser (And Why Should You Care)? ... Ever wondered what happens behind the scenes when computers process text, code, or data? That&#39;s where parsers com..."
2,https://www.huntress.com/cybersecurity-101/topics/what-is-a-parser,"What Is a Parser? A Beginner-Friendly Guide to ... - Huntress","May 27, 2025 — What&#39;s a Parser (And Why Should You Care)? ... Ever wondered what happens behind the scenes when computers process text, code, or data? That&#39;s where parsers com..."
3,"https://www.techtarget.com/searchapparchitecture/definition/parser#:~:text=In%20computer%20technology%2C%20a%20parser,necessary%20input%20has%20been%20provided.","What is a Parser? Definition, Types and Examples - TechTarget","Jul 7, 2022 — What is a parser? In computer technology, a parser is a program that&#39;s usually part of a compiler. It receives input in the form of sequential source program in..."
suggerimento

Nel Formato generale dei risultati viene utilizzato il motore di modelli Template Toolkit per l'output dell'array $links in un ciclo FOREACH.

Nel nome del file dei risultati è sufficiente cambiare l'estensione del file in csv.

Impostazioni possibili

Nome parametroValore predefinitoDescrizione
Results languageAuto (Based on IP)Scelta della lingua dei risultati (parametro lr=)
Search from countryAuto (Based on IP)Scelta del paese da cui viene effettuata la ricerca (ricerca geo-dipendente, parametro gl=)
Location (city)Ricerca per città, regione. È possibile indicare le città nel formato novosibirsk, russia; l'elenco completo delle località è disponibile in Geotargets (copia - è necessario utilizzare il valore della colonna Canonical Name). È inoltre necessario impostare il dominio Google corretto
Util::ReCaptcha2 presetdefaultDefinisce se utilizzare Util::ReCaptcha2Util::ReCaptcha2 per aggirare i ReCaptcha
Util::AntiGate presetdefaultDefinisce se utilizzare Util::AntiGateUtil::AntiGate per aggirare i captcha grafici
ReCaptcha2 retries3Numero di tentativi di invio della risposta per il ReCaptcha per il numero di volte indicato, senza cambiare proxy
ReCaptcha2 pass proxyConsente di passare i proxy (utilizzati nella query a Google) e i cookie (ricevuti nella risposta da Google) al servizio di riconoscimento ReCaptcha
Use sessionsSalva le sessioni valide, consentendo uno scraping ancora più veloce e riducendo il numero di errori.
Don't take sessionPossibilità di non utilizzare le sessioni valide salvate
Additional headersConsente di specificare qualsiasi intestazione personalizzata
Redirect browser max pages10Numero di pagine del browser utilizzate per aggirare la protezione sotto forma di controllo del JavaScript abilitato