SE::Baidu - Scraper wyników wyszukiwania Baidu

Przegląd scrapera
Scraper wyników wyszukiwania Baidu. Dzięki scraperowi Baidu będziesz mógł pozyskiwać ogromne bazy linków, gotowych do dalszego wykorzystania. Możesz używać zapytań w takiej samej formie, w jakiej wpisujesz je w wyszukiwarkę Bing, wliczając w to operatory wyszukiwania (filetype, site, intitle).
Funkcjonalność A-Parser pozwala zapisywać ustawienia scrapowania scrapera Baidu do dalszego wykorzystania (presety), ustalać harmonogram scrapowania i wiele więcej. Możesz korzystać z automatycznego rozmnażania zapytań, podstawiania podzapytań z plików, generowania kombinacji alfanumerycznych i list w celu uzyskania maksymalnej możliwej liczby wyników.
W scraperze Baidu zapisywanie wyników jest możliwe w takiej formie i strukturze, jakiej potrzebujesz, dzięki wbudowanemu potężnemu silnikowi szablonów Template Toolkit, który pozwala na stosowanie dodatkowej logiki do wyników i wyprowadzanie danych w różnych formatach, w tym JSON, SQL i CSV.
Przypadki użycia scrapera
🔗 Scrapowanie pełnych linków Baidu
W tym zasobie pokazano, jak można scrapować pełne linki
🔗 Podpowiedzi Baidu
Wielopoziomowe scrapowanie podpowiedzi Baidu
🔗 JS scraper JS::SE::Baidu::Suggest
Tworzenie scraperów JS. Pobieranie podpowiedzi Baidu
Zbierane dane
- Linki
- Snippety
- Kotwice (anchory)
- Całkowita liczba wyników
- Lista powiązanych słów
- Liczba stron wyników

Możliwości
- Scrapuje do 5000 wyników na zapytanie
- Wsparcie dla wszystkich operatorów wyszukiwania Baidu (filetype:, site:, intitle:).
- Zbiera wyniki wyszukiwania oraz powiązane słowa kluczowe
- Konwersja skróconych linków na pełne (opcja Get full links)
Warianty użycia
- Zbieranie baz linków - dla A-Poster, XRumer, AllSubmitter itp.
- Ocena konkurencji dla słów kluczowych
- Sprawdzanie indeksacji stron
- Zbieranie stron zawierających określone słowa kluczowe w tytule strony
Zapytania
Jako zapytania należy podawać frazy wyszukiwania, na przykład:
test
site:www.baidu.com
百度产品大全
intitle:scraper
Podstawianie zapytań
Możesz użyć wbudowanych makr do rozmnażania zapytań, na przykład chcemy uzyskać bardzo dużą bazę forów, podajmy kilka głównych zapytań w różnych językach:
forum
forum
foro
论坛
W formacie zapytań wskażemy generowanie znaków od a do zzzz, ta metoda pozwala maksymalnie rotować wyniki wyszukiwania i uzyskiwać mnóstwo nowych unikalnych wyników:
$query {az:a:zzzz}
To makro utworzy 475254 dodatkowych zapytań dla każdego wyjściowego zapytania, co w sumie da 4 x 475254 = 1901016 zapytań, liczba imponująca, ale to żaden problem dla A-Parser. Przy prędkości 2000 zapytań na minutę takie zadanie zostanie przetworzone w zaledwie 16 godzin.
Użycie operatorów
Możesz używać operatorów wyszukiwania w formacie zapytania, dzięki czemu zostaną one automatycznie dodane do każdego zapytania z Twojej listy:
site:$query
Warianty wyprowadzania wyników
A-Parser obsługuje elastyczne formatowanie wyników dzięki wbudowanemu silnikowi szablonów Template Toolkit, co pozwala mu wyprowadzać wyniki w dowolnej formie, a także w ustrukturyzowanej, np. CSV lub JSON
Eksport listy linków
Analogicznie jak w SE::Google.
Linki + kotwice + snippety z wyprowadzeniem pozycji
Analogicznie jak w SE::Google.
Wyprowadzanie linków, kotwic i snippetów do tabeli CSV
Analogicznie jak w SE::Google.
Zapisywanie powiązanych słów kluczowych
Analogicznie jak w SE::Google.
Konkurencja słów kluczowych
Analogicznie jak w SE::Google.
Sprawdzanie indeksacji linków
Analogicznie jak w SE::Google.
Zapisywanie w formacie SQL
Analogicznie jak w SE::Google.
Zrzut wyników do JSON
Analogicznie jak w SE::Google.
Obróbka wyników
A-Parser pozwala przetwarzać wyniki bezpośrednio podczas scrapowania, w tej sekcji przedstawiliśmy najpopularniejsze przypadki dla scrapera Baidu
Usuwanie duplikatów linków
Analogicznie jak w SE::Google.
Usuwanie duplikatów linków według domeny
Analogicznie jak w SE::Google.
Wyodrębnianie domen
Analogicznie jak w SE::Google.
Usuwanie tagów z kotwic i snippetów
Analogicznie jak w SE::Google.
Filtrowanie linków według występowania
Analogicznie jak w SE::Google.
Możliwe ustawienia
| Nazwa parametru | Wartość domyślna | Opis |
|---|---|---|
| Pages count | 5 | Liczba stron do scrapowania (od 1 do 100) |
| Links per page | 50 | Liczba linków w wynikach na każdą stronę (10 / 20 / 50) |
| Get full links | ☐ | Konwersja skróconych linków na pełne (domyślnie wyłączona) |