Как спарсить страницы сайта с индекса Google

  • Автор темы Автор темы Smash
  • Дата начала Дата начала

Smash

New Member
Доброго времени суток!

Подскажите пожалуйста как спарсить все страницы определенного сайта которые находятся в индексе Google.

Использую А-парсер, попробовал через Редактор заданий создать, какие еще там нужно указывать настройки? Сайтв в гугле имеет 11к страниц - хочу их выгрузить одним файлом


Спасибо!
 
Добрый день.
Вам нужны ссылки на все страницы или сами страницы?
 
мне нужно чтобы в файле были все ссылки на страницы сайта
Увеличьте кол-во страниц (Pages count) до максимума и добавьте функцию Parse all results (http://a-parser.com/wiki/advanced-options/#parse-all-results). Ну и уник по строке лучше включить. Это не гарантирует парсинг абсолютно всех ссылок, но все же позволит спарсить намного больше.
что Вы имеете ввиду, сами страницы?)
Страницы сайта
 
Увеличьте кол-во страниц (Pages count) до максимума и добавьте функцию Parse all results (http://a-parser.com/wiki/advanced-options/#parse-all-results). Ну и уник по строке лучше включить. Это не гарантирует парсинг абсолютно всех ссылок, но все же позволит спарсить намного больше.

Страницы сайта
что-то не выходит
Вы можете привести скриншоты по пунктам что Вы меняете/добавляете в настройках?
 
Mb4iZ.png

wzHS7.png
 
хочу спарсить все результаты по 1 запросу
гугл говорит по этому запросу About 454,000 results
ставлю Pages count: 10, включаю Parse all results

в результате парсится ~50k уникальных страниц
287

Всё верно? Больше никак нельзя?
 

Вложения

  • a-pars-result.png
    a-pars-result.png
    5,1 КБ · Просмотры: 58
хочу спарсить все результаты по 1 запросу
гугл говорит по этому запросу About 454,000 results
ставлю Pages count: 10, включаю Parse all results

в результате парсится ~50k уникальных страниц
287

Всё верно? Больше никак нельзя?
попробуй например макросами разбавить запросы, каким-нибудь {num:1:100} и {az:a:zzz}/{az:а:яяя}
 
Назад
Верх