1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Как спарсить страницы сайта с индекса Google

Тема в разделе "Техническая поддержка", создана пользователем Smash, 9 фев 2016.

  1. Smash

    Smash New Member

    Регистрация:
    9 фев 2016
    Сообщения:
    4
    Симпатии:
    0
    Доброго времени суток!

    Подскажите пожалуйста как спарсить все страницы определенного сайта которые находятся в индексе Google.

    Использую А-парсер, попробовал через Редактор заданий создать, какие еще там нужно указывать настройки? Сайтв в гугле имеет 11к страниц - хочу их выгрузить одним файлом
    [​IMG]

    Спасибо!
     
  2. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Добрый день.
    Вам нужны ссылки на все страницы или сами страницы?
     
    Smash нравится это.
  3. Smash

    Smash New Member

    Регистрация:
    9 фев 2016
    Сообщения:
    4
    Симпатии:
    0
    мне нужно чтобы в файле были все ссылки на страницы сайта

    что Вы имеете ввиду, сами страницы?)
     
  4. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Увеличьте кол-во страниц (Pages count) до максимума и добавьте функцию Parse all results (http://a-parser.com/wiki/advanced-options/#parse-all-results). Ну и уник по строке лучше включить. Это не гарантирует парсинг абсолютно всех ссылок, но все же позволит спарсить намного больше.
    Страницы сайта
     
  5. Smash

    Smash New Member

    Регистрация:
    9 фев 2016
    Сообщения:
    4
    Симпатии:
    0
    что-то не выходит
    Вы можете привести скриншоты по пунктам что Вы меняете/добавляете в настройках?
     
  6. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
  7. Bombero

    Bombero A-Parser Pro License
    A-Parser Pro

    Регистрация:
    21 май 2014
    Сообщения:
    1
    Симпатии:
    0
    хочу спарсить все результаты по 1 запросу
    гугл говорит по этому запросу About 454,000 results
    ставлю Pages count: 10, включаю Parse all results

    в результате парсится ~50k уникальных страниц
    [​IMG]
    Всё верно? Больше никак нельзя?
     

    Вложения:

  8. DeLaKroiX

    DeLaKroiX A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 дек 2015
    Сообщения:
    267
    Симпатии:
    96
    попробуй например макросами разбавить запросы, каким-нибудь {num:1:100} и {az:a:zzz}/{az:а:яяя}
     
    Support и Bombero нравится это.
  9. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    можно попробовать как выше писали про макросы, но сам гугл может легко завышать число результатов на 1-2 порядка от реального числа
     

Поделиться этой страницей