SE::Bing - Scraper de résultats de recherche Bing

Présentation du scraper
Scraper de la page de résultats de recherche Bing. Grâce au scraper SE::Bing, vous pourrez obtenir d'énormes bases de liens prêts pour une utilisation ultérieure. Vous pouvez utiliser les requêtes de la même manière que vous les saisissez dans la barre de recherche Bing, y compris les opérateurs de recherche (contains, intitle, language, site, etc.). Plus de détails sur la page officielle Advanced search keywords.
La fonctionnalité d'A-Parser permet de sauvegarder les paramètres de collecte de données du scraper Bing pour une utilisation ultérieure (présélections), de définir un calendrier de collecte et bien plus encore. Vous pouvez utiliser la multiplication automatique des requêtes, la substitution de sous-requêtes à partir de fichiers, la génération de combinaisons alphanumériques et de listes pour obtenir le maximum de résultats possible.
La sauvegarde des résultats est possible dans la forme et la structure dont vous avez besoin, grâce au puissant moteur de gabarit intégré Template Toolkit qui permet d'appliquer une logique supplémentaire aux résultats et d'afficher les données dans divers formats, y compris JSON, SQL et CSV.
Cas d'utilisation du scraper
🔗 Collecte de données des résultats de recherche Bing
Collecte de données Bing avec multiplication automatique des requêtes (Parser tous les résultats / Parse all results)
🔗 Collecte de données du top 10 et du contenu des balises
Collecte de données multiniveau. Nous collectons le top 10 et le contenu des balises title et description pour ces sites
🔗 Scraper JS basé sur le scraper Bing
Création de scrapers JS. Récupération des résultats d'un scraper standard
🔗 Collecte de tous les résultats dans Bing
Collecte de données avec substitution intelligente des requêtes via le moteur de templates Template Toolkit et tools.query.add
🔗 Déduplication dans Bing
Collecte d'URLs uniques par mot-clé avec déduplication par domaine, avec la possibilité de spécifier le nombre maximum d'URLs par domaine
🔗 Plusieurs scrapers dans une présélection
La présélection montre un exemple d'utilisation de plusieurs scrapers
Données collectées
- Nombre de résultats par requête
- Liens, ancres et snippets des résultats de recherche
- Liste de mots-clés associés (Related keywords)
- Liens, liens visibles, ancres, snippets et position publicitaire des résultats payants

Fonctionnalités
- Prise en charge de tous les opérateurs de recherche Bing (site:, ip:, etc.). Plus de détails sur les opérateurs de recherche sur la page officielle Advanced search keywords.
- Scrape le nombre maximum de résultats fournis par Bing - jusqu'à 200 pages de résultats
- Peut automatiquement scraper plus de 1000 résultats par requête - ajoute des caractères supplémentaires (option Parser tous les résultats / Parse all results)
- Possibilité de parser jusqu'au niveau / Parse to level pour les mots-clés associés
- Possibilité de rechercher des mots-clés associés
- Possibilité de scraper les liens vers les pages en cache
- Possibilité de scraper les résultats mobiles
- Prise en charge du chargement des données lors du défilement dans la version mobile
Les scrapers suivants fonctionnent sur la base du scraper Bing :
SE::Bing::Position - détermination des positions de n'importe quels sites dans les résultats de recherche selon une liste de requêtes
Variantes d'utilisation
- Collecte de bases de liens - pour A-Poster, XRumer, AllSubmitter, etc.
- Évaluation de la concurrence pour les mots-clés
- Recherche de backlinks (mentions) de sites
- Vérification de l'indexation des sites
- Recherche de sites vulnérables
- Recherche de sites sur une même adresse IP
- Toute autre variante impliquant la collecte de données de Bing sous une forme ou une autre
Requêtes
Comme requêtes, il est nécessaire d'indiquer des phrases de recherche, exactement comme si elles étaient saisies directement dans le formulaire de recherche de Bing, par exemple :
test
fenêtres Moscou
site:http://lenta.ru
ip:222.36.12.12
Substitutions de requêtes
Vous pouvez utiliser les macros intégrées pour multiplier les requêtes, par exemple si nous voulons obtenir une très grande base de forums, indiquons quelques requêtes de base dans différentes langues :
forum
forum
foro
论坛
Dans le format des requêtes, indiquons une itération de caractères de a à zzzz, cette méthode permet de faire pivoter au maximum les résultats de recherche et d'obtenir de nombreux nouveaux résultats uniques :
$query {az:a:zzzz}
Cette macro créera 475254 requêtes supplémentaires pour chaque requête de recherche initiale, ce qui donnera au total 4 x 475254 = 1901016 requêtes de recherche, un chiffre impressionnant, mais ce n'est pas du tout un problème pour A-Parser. À une vitesse de 2000 requêtes par minute, une telle tâche sera traitée en seulement 16 heures.
Utilisation d'opérateurs
Vous pouvez utiliser des opérateurs de recherche dans le format de la requête, ainsi il sera automatiquement ajouté à chaque requête de votre liste :
site:$query
Variantes d'affichage des résultats
A-Parser prend en charge un formatage flexible des résultats grâce au moteur de gabarit intégré Template Toolkit, ce qui lui permet d'afficher les résultats sous une forme libre, ainsi que structurée, par exemple CSV ou JSON
Exportation d'une liste de liens
Liens + ancres + snippets avec affichage de la position
Affichage des liens, ancres et snippets dans un tableau CSV
Sauvegarde des mots-clés associés
Concurrence des mots-clés
Vérification de l'indexation des liens
Sauvegarde au format SQL
Dump des résultats en JSON
Traitement des résultats
A-Parser permet de traiter les résultats directement pendant la collecte de données, dans cette section nous avons listé les cas les plus populaires pour le scraper Bing
Déduplication des liens
Déduplication des liens par domaine
Extraction de domaines
Suppression des balises des ancres et snippets
Filtrage des liens par inclusion
Paramètres possibles
| Nom du paramètre | Valeur par défaut | Description |
|---|---|---|
| Pages count | 10 | Nombre de pages à scraper (de 1 à 200) |
| Region | Based on IP | Choix de la région. Liste des régions. |
| Interface language | Any | Choix de la langue de l'interface. Liste des langues. |
| Safe Search | Moderate | Choix de l'option de recherche sécurisée (Strict / Moderate / Off) |
| Device | Desktop | Choix de l'appareil de recherche (Desktop / Mobile) |
| Show inaccessible results | ☐ | Permet d'activer l'affichage des résultats cachés |
| Stop pagination by results count | 0 | Arrêt du parcours de la pagination lors de l'atteinte d'un nombre donné de résultats. Fonctionne en complément de Pages count, la collecte s'arrête selon ce qui est atteint en premier : le nombre de pages défini ou le nombre de résultats défini. |