1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

A-Parser - парсер для профессионалов SEO

июл
20
by Forbidden at 09:14
(2.548 Просмотров / 5 Симпатии)
1 Комментарии
После ужесточения парсинга со стороны гугла A-Parser стал парсить его быстрее чем раньше, результаты тестирования парсинга в 1000 потоков, 1 страница по 100 результатов - более 4000 запросов в минуту

[​IMG]

Улучшения
  • Переработан парсер SE::Google SE::Google - увеличена скорость парсинга в 10-20 раз
  • Названия пресетов заданий теперь сортируются при добавлении
Исправления
  • SE::Google SE::Google - исправлена обработка каптчи в связи с изменением выдачи
  • Net::Whois Net::Whois - исправлена работа с некоторыми зонами
  • SE::Yandex::Register SE::Yandex::Register - исправлена работа с каптчей при регистрации аккаунта
  • Исправлено отображение дебаг информации для прокси чекеров
июл
06
by Forbidden at 08:04
(1.910 Просмотров / 2 Симпатии)
0 Комментарии
Улучшения
  • В очереди заданий теперь запоминается текущая страница отдельно для активных и завершенных задач
  • Добавлена возможность вывести время выполнения каждого запроса
Исправления в связи с изменениями в выдаче
Исправления
  • Улучшена обработка кодировки текста в HTML::TextExtractor HTML::TextExtractor
  • В очереди заданий в некоторых случаях могли не отображаться кнопки управления заданием
июн
27
by Support at 17:50
(9.801 Просмотров / 8 Симпатии)
1 Комментарии
14-й выпуск Сборника рецептов. Сегодня мы научимся делать кастомные парсеры с помощью XPath, будем анализировать страницы сайта и попробуем делать комбинированные пресеты. Кроме этого ниже обновление 2-х самых популярных пресетов и небольшой сюрприз:) Поехали!

Быстрое создание кастомного парсера поисковой системы с помощью XPath
В A-Parser есть парсеры для большинства популярных поисковых систем. Но реализовать и поддерживать парсеры для абсолютно всех существующих поисковиков очень сложно, поэтому нам на помощь приходит Net::HTTP Net::HTTP с его замечательной возможностью парсить практически все. В данной статье речь пойдет о том, как с помощью XPath и Net::HTTP Net::HTTP довольно быстро и легко создать кастомный парсер почти любой поисковой системы. Подробности -...
июн
21
by Forbidden at 15:39
(3.985 Просмотров / 5 Симпатии)
3 Комментарии
Денис Бартаев рассказывает, как в несколько кликов создать парсер любой поисковой системы на примере Rambler.ru. Мы получим всю необходимую информацию: ссылки, анкоры, сниппеты, число результатов, связанные ключевые слова и проверку на опечатку в запросе.



В уроке рассмотрены
  • Использование XPath для создания кастомного парсера
  • Обход капчи без использования Antigate
  • Использование Template toolkit для форматирования результата
  • Объединение результатов парсинга в массив объектов с полями, связанными по индексу

Подписывайтесь на наш канал!

Оставляйте в комментариях свои идеи и пожелания для будущих видео
июн
08
by Forbidden at 09:45
(2.068 Просмотров / 0 Симпатии)
0 Комментарии

Улучшения

  • Теперь для парсеров Net::HTTP Net::HTTP, HTML::TextExtractor HTML::TextExtractor, HTML::LinkExtractor HTML::LinkExtractor, Rank::CMS Rank::CMS кэшируются одинаковые HTTP запросы при использовании любой комбинации из этих парсеров в одном задании, что исключает выполнение повторных запросов к одному URL, как следствие растет скорость, уменьшается нагрузка на целевые сайты
  • Добавлена опция Max connections per host позволяющая ограничить максимальное число одновременных подключений к одному домену/IP
  • Добавлена опция Global proxy ban позволяющая расшарить статистику по бану проксей между заданиями
  • В парсере HTML::TextExtractor HTML::TextExtractor улучшено отображение табличных данных и списков
  • В парсере SE::Yandex::WordStat SE::Yandex::WordStat добавлена возможность указать минимальную частотность для добавления запроса на вложенный парсинг
  • В парсере SE::Yandex SE::Yandex добавлена опция Parse all results позволяющая автоматически...