SE::Baidu - Scraper för Baidus sökresultat

Översikt av scrapern
Scraper för Baidus sökresultat. Tack vare Baidu-scrapern kan du få enorma databaser med länkar, redo för vidare användning. Du kan använda sökfrågor på samma sätt som du skriver in dem i Bings sökfält, inklusive sökoperatörer (filetype, site, intitle).
Funktionaliteten i A-Parser gör det möjligt att spara inställningar för Baidu-scrapern för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer. Du kan använda automatisk multiplikation av sökfrågor, infogning av undersökfrågor från filer, generering av alfanumeriska kombinationer och listor för att få största möjliga antal resultat.
I Baidu-scrapern är det möjligt att spara resultat i det format och den struktur du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa extra logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.
Användningsfall för scrapern
🔗 Dataskrapning av fullständiga Baidu-länkar
Denna resurs visar hur man kan skrapa fullständiga länkar
🔗 Baidu-förslag
Flernivå-dataskrapning av Baidu-förslag
🔗 JS-scraper JS::SE::Baidu::Suggest
Skapa JS-scrapers. Hämtning av Baidu-förslag
Insamlade data
- Länkar
- Snippets
- Ankare
- Totalt antal resultat
- Lista över relaterade ord
- Antal sidor i sökresultatet

Funktioner
- Skrapar upp till 5000 resultat per sökfråga
- Stöd för alla Baidu sökoperatörer (filetype:, site:, intitle:).
- Samlar in sökresultat och relaterade sökord
- Omvandling av förkortade länkar till fullständiga (alternativet Get full links)
Användningsområden
- Insamling av länkdatabaser - för A-Poster, XRumer, AllSubmitter osv.
- Bedömning av konkurrens för sökord
- Kontroll av webbplatsers indexering
- Insamling av sidor som innehåller specifika sökord i sidtiteln
Sökfrågor
Som sökfrågor ska sökfraser anges, till exempel:
test
site:www.baidu.com
百度产品大全
intitle:scraper
Sökfrågesubstitutioner
Du kan använda inbyggda makron för att multiplicera sökfrågor, till exempel om vi vill få en mycket stor databas med forum, anger vi några huvudsökfrågor på olika språk:
forum
forum
foro
论坛
I sökfrågeformatet anger vi en genomgång av tecken från a till zzzz, denna metod gör det möjligt att rotera sökresultaten maximalt och få många nya unika resultat:
$query {az:a:zzzz}
Detta makro kommer att skapa 475254 extra sökfrågor för varje ursprunglig sökfråga, vilket totalt ger 4 x 475254 = 1901016 sökfrågor. Siffran är imponerande, men det är inget problem för A-Parser. Med en hastighet på 2000 sökfrågor per minut kommer en sådan uppgift att bearbetas på bara 16 timmar.
Användning av operatörer
Du kan använda sökoperatörer i sökfrågeformatet, så att de automatiskt läggs till i varje sökfråga från din lista:
site:$query
Exempel på resultatutmatning
A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör att den kan mata ut resultat i valfri form, såväl som i strukturerad form, till exempel CSV eller JSON
Export av länklista
På samma sätt som i SE::Google.
Länkar + ankare + snippets med position
På samma sätt som i SE::Google.
Utmatning av länkar, ankare och snippets i en CSV-tabell
På samma sätt som i SE::Google.
Spara relaterade sökord
På samma sätt som i SE::Google.
Sökordskonkurrens
På samma sätt som i SE::Google.
Kontroll av länkindexering
På samma sätt som i SE::Google.
Spara i SQL-format
På samma sätt som i SE::Google.
Dumpa resultat till JSON
På samma sätt som i SE::Google.
Bearbetning av resultat
A-Parser gör det möjligt att bearbeta resultat direkt under dataskrapningen. I det här avsnittet har vi listat de mest populära fallen för Baidu-scrapern
Dubblettkontroll av länkar
På samma sätt som i SE::Google.
Dubblettkontroll av länkar per domän
På samma sätt som i SE::Google.
Extrahera domäner
På samma sätt som i SE::Google.
Ta bort taggar från ankare och snippets
På samma sätt som i SE::Google.
Filtrering av länkar efter förekomst
På samma sätt som i SE::Google.
Möjliga inställningar
| Parameternamn | Standardvärde | Beskrivning |
|---|---|---|
| Pages count | 5 | Antal sidor att skrapa (från 1 till 100) |
| Links per page | 50 | Antal länkar i resultatet per sida (10 / 20 / 50) |
| Get full links | ☐ | Omvandling av förkortade länkar till fullständiga (avstängd som standard) |