1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 1500+ и мы растем!
    Скрыть объявление

A-Parser - парсер для профессионалов SEO

окт
23
by Support at 08:48
(764 Просмотров / 0 Симпатии)
0 Комментарии
44-й сборник рецептов, в который вошли парсер, определяющий категории сайтов (используя сервис Cloudflare Radar), парсер Rozetka через API и парсер интернет-магазина kufar.by с проходом по списку результатов.

Парсер Cloudflare Radar
Парсер для сбора категорий сайтов из Cloudflare Radar

Rozetka - получение данных по API
Парсер, собирающий данные о товарах на торговой площадке Rozetka через API.
[​IMG]

Парсинг объявлений kufar.by
Парсер объявлений на сайте kufar.by с проходом по списку результатов. Собираются заголовки объявлений, цены, имена и телефоны авторов.
[​IMG]

А также, обновлены следующие ресурсы:
  • ...
сен
22
by Support at 14:16
(1.448 Просмотров / 0 Симпатии)
0 Комментарии
43-й сборник рецептов, в который вошли пресет для парсинга освобождающихся доменов, парсер категорий сайтов и пример сбора данных из PDF документов.

Аукцион доменов REG.RU
Пресет, позволяющий парсить домены с аукциона Reg.ru. В пресете реализована возможность указывать количество страниц пагинации и использовать фильтр по ключевому слову.


Определение категорий сайта
Парсер, собирающий категории сайтов из MegaIndex.
[​IMG]

Парсинг PDF
Пример парсинга данных из документов в формате PDF. Для работы используется Node.js модуль pdf-parse.
[​IMG]

Кроме этого:
сен
09
by Support Alex at 13:16
(2.187 Просмотров / 0 Симпатии)
0 Комментарии
В этом видео уроке рассмотрены ответы на 3 часто задаваемых вопроса от новых пользователей А-Парсера


  1. Где и как можно посмотреть результаты парсинга?
  2. Как подключить прокси с авторизацией?
  3. Extra query string, что это такое и как применять эту опцию?
В уроке рассмотрено:
  • Просмотр результатов парсинга 3-мя способами:
    • Способ первый. "Из очереди заданий, если задание на паузе".
    • Способ второй. "Из очереди заданий, если задание завершено".
    • Способ третий. "Забираем результат из папки results".
  • Подключение прокси с авторизацией.
  • Примеры использования опции Extra query string.
Полезные ссылки:
авг
25
by Support at 13:41
(2.640 Просмотров / 1 Симпатии)
0 Комментарии
В 12-м сборнике статей рассказывается о принципах работы парсеров и факторах, влияющих на их скорость, показаны возможности debug режима в Тестовом парсинге по отладке запросов, а также на реальном примере разбирается работа с куками.

Скорость и принцип работы парсеров
В этой статье подробно рассказано об основном принципе работы парсеров и скорости их работы, а также рассмотрены основные факторы, влияющие на скорость парсинга.

Использование Debug режима
В этой статье рассказывается об одном из методов отладки парсеров, а также об анализе получаемых данных - debug режиме в Тестовом парсинге. С его помощью можно прямо в парсере анализировать и экспериментировать с заголовками и изучать приходящие в ответ данные.
[​IMG]...
июл
16
by Support Alex at 14:42
(3.022 Просмотров / 0 Симпатии)
0 Комментарии
Улучшения
  • Добавлен парсер Rank::MOZ Rank::MOZ.
    Собираемые данные: вся информация, содержащаяся на странице.
  • Добавлены парсеры SecurityTrails::Domain SecurityTrails::Domain и SecurityTrails::IP SecurityTrails::IP.
    Для работы парсеров необходимо указать пресет Util::ReCaptcha2 Util::ReCaptcha2.
    • SecurityTrails::IP SecurityTrails::IP
      В качестве запроса следует указывать ipv4 адрес.
      Собирает домены по IP и информацию о них.
    • SecurityTrails::Domain SecurityTrails::Domain
      В качестве запроса следует указывать домен, например a-parser.com.
      Собираемые данные:
      • Данные по DNS
      • Список технологий, используемых на сайте (движки и проч.)
      • Список открытых портов
      • Alexa rank
      • Страна
      • Хостер
      • Даты начала и окончания регистрации
      • Whois статус
      • Регистратор
      • Список исторических данных по DNS
      • Список субдоменов
  • Добавлена возможность отключать валидацию TLS сертификатов.
  • Добавлена поддержка доменных прокси.
...