Ga naar de hoofdinhoud

SE::AOL::Suggest - Scraper voor AOL-zoeksuggesties

Overzicht van de scraper

Scraper voor zoekwoordsuggesties in AOL. Dankzij de SE::AOL::Suggest scraper kunt u automatisch databases met zoekwoorden verzamelen uit de suggesties van de AOL-zoekmachine op basis van een query. Door de SE::AOL::Suggest scraper te gebruiken, kunt u eenvoudig en snel AOL-suggesties per query scrapen.

Dankzij de multithreading van A-Parser kan de verwerkingssnelheid van query's oplopen tot 4700 query's per minuut, wat gemiddeld resulteert in 13500-14500 resultaten per minuut.

Scraper overzicht: werksnelheid

U kunt automatische query-vermenigvuldiging gebruiken, subquery's uit bestanden invoegen, alfanumerieke combinaties en lijsten doorlopen om het maximaal mogelijke aantal resultaten te verkrijgen. Met behulp van resultaatfiltering kunt u het resultaat direct opschonen door alle ongewenste ruis te verwijderen (met behulp van uitsluitingswoorden).

De functionaliteit van A-Parser maakt het mogelijk om de instellingen voor gegevensextractie van de SE::AOL::Suggest scraper op te slaan voor toekomstig gebruik (presets), extractieschema's in te stellen en nog veel meer.

Het opslaan van resultaten is mogelijk in de vorm en structuur die u nodig heeft, dankzij de ingebouwde krachtige sjabloon-engine Template Toolkit, waarmee u extra logica op de resultaten kunt toepassen en gegevens in verschillende formaten kunt uitvoeren, waaronder JSON, SQL en CSV.

Verzamelde gegevens

  • Aantal resultaten per query
  • Suggesties bij de query

welke gegevens verzamelt de SE::AOL::Suggest scraper

Mogelijkheden

  • Ondersteuning voor alle AOL-zoekoperators (site: enz.)
  • Scrapt het maximale aantal resultaten dat door AOL wordt gegeven - 100 pagina's met 20 elementen per resultatenpagina

Toepassingen

  • Verzamelen van zoekwoorddatabases

Query's

Als query's moeten zoekfrasen worden opgegeven, bijvoorbeeld:

write essay
Football
Speak in english
forex
cheap essay

Query-substituties

U kunt ingebouwde macro's gebruiken voor de automatische substitutie van subquery's uit bestanden. Als we bijvoorbeeld aan elke query een lijst met andere woorden willen toevoegen, geven we enkele basisquery's op:

essay
article
thesis

In het queryformaat geven we de macro op voor de substitutie van extra woorden uit het bestand Keywords.txt. Deze methode vergroot de variatie van query's aanzienlijk:

{subs:Keywords} $query 

Deze macro maakt voor elke oorspronkelijke zoekopdracht evenveel extra query's aan als er in het bestand staan, wat resulteert in [aantal oorspronkelijke query's] x [aantal query's in het bestand Keywords] = [totaal aantal query's] als resultaat van de macro.

Bijvoorbeeld, als het bestand Keywords.txt het volgende bevat:

buy
cheap

Uiteindelijk zal de substitutie-macro de 3 basisquery's veranderen in 6:

buy essay
cheap essay
buy article
cheap article
buy thesis
cheap thesis

Voorbeelden van resultaatuitvoer

A-Parser ondersteunt flexibele formattering van resultaten dankzij de ingebouwde sjabloon-engine Template Toolkit, waardoor resultaten in een vrije vorm of gestructureerd, zoals CSV of JSON, kunnen worden uitgevoerd.

Export van de lijst met suggesties

Hetzelfde als in SE::Google::Suggest.

Uitvoer naar CSV-tabel

Hetzelfde als in SE::Google::Suggest.

Opslaan in SQL-formaat

Resultaatformaat:

[% FOREACH results;
"INSERT INTO serp VALUES('" _ query _ "', '"; suggest _ "')\n";
END %]

Voorbeeld van resultaat:

INSERT INTO serp VALUES('write essay', 'write essay for me')
INSERT INTO serp VALUES('write essay', 'write essay')
INSERT INTO serp VALUES('write essay', 'write essay online')
INSERT INTO serp VALUES('write essay', 'write essay for you')
INSERT INTO serp VALUES('write essay', 'write essay free')
INSERT INTO serp VALUES('write essay', 'write essay conclusion')
INSERT INTO serp VALUES('write essay', 'write essay today')
INSERT INTO serp VALUES('write essay', 'write essays for money')
...

Resultaten dumpen naar JSON

Hetzelfde als in SE::Google::Suggest.

Verwerking van resultaten

A-Parser maakt het mogelijk om resultaten direct tijdens het scrapen te verwerken. In dit gedeelte hebben we de meest populaire cases voor de SE::AOL::Suggest scraper opgenomen.

Optie Scrapen tot niveau (Parse to level)

Hetzelfde als in SE::Google::Suggest.

Resultaatfiltering (gebruik van uitsluitingswoorden)

Hetzelfde als in SE::Google::Suggest.

Mogelijke instellingen