1.1.811 - 6 новых парсеров, улучшения в JavaScript парсерах

Forbidden

Administrator
Команда форума
A-Parser Enterprise
4m5m5.png


В A-Parser 1.1.811 добавлено 6 новых встроенных парсеров - Амазон, Яндекс.Маркет, Рамблер, IxQuick, добавление ссылки в индекс Bing, расширенный парсер Moz(OpenSiteExplorer). Добавляйте идеи для новых парсеров на нашем форуме и мы их обязательно реализуем

Помимо встроенных парсеров вы можете создавать свои собственные парсеры на языке JavaScript - используя всю мощь многопоточности A-Parser'а, а также производительность движка V8 и преимущества ES6.

Для владельцев CapMonster и XEvil - напоминаем что A-Parser можно подключить к этим программам из коробки, тем самым колоссально повысив скорость парсинга во многих парсерах

Улучшения
  • Новый парсер Shop::Amazon Shop::Amazon - парсит выдачу https://www.amazon.com по ключевому слову, собирает название, ссылку, картинку, прайс, прайс до скидки, рейтинг, число комментариев, продавца и дополнительную информацию
  • Новый парсер Shop::Yandex::Market Shop::Yandex::Market - парсер Яндекс.Маркета, по указанному ключевому слову(или по прямой ссылке на категорию) собирает следующие данные: название товара, ссылку, ссылку на картинку, рейтинг, число комментариев, цену от и до, число предложений от магазинов и список дополнительных характеристик
  • Новый парсер SE::Rambler SE::Rambler - сегодня рамблер использует одновременно выдачу Google и Яндекса, в зависимости от геолокации пользователя(прокси), есть поддержка антигейта
  • Новый парсер SE::IxQuick SE::IxQuick - https://www.ixquick.com - еще один поисковик, основанный на выдаче Google
  • Добавление ссылок в индекс Бинга - SE::Bing::AddURL SE::Bing::AddURL - добавляет ваши ссылки в промышленных масштабах, требуется антигейт
  • Новый парсер Rank::OpenSiteExplorer::Extended Rank::OpenSiteExplorer::Extended - расширенная версия парсера Rank::OpenSiteExplorer Rank::OpenSiteExplorer, собирает с https://moz.com 39 параметров по домену, сабдомену и странице
  • JavaScript парсеры: новые методы this.util.urlFromHTML(url, [base]) и this.util.updateResultsData(results, data)
  • В парсере SE::Yandex SE::Yandex добавлен сбор времени последнего кэширования страницы
Исправления в связи с изменениями в выдаче
  • SE::Yandex SE::Yandex - исправлен парсинг выдачи, сбор ссылки на кэш страницы, а также парсинг рекламных объявлений
  • SE::Google SE::Google - исправлен парсинг рекламных объявлений, а также проблема с парсингом в редких случаях при использовании антигейта
  • В парсере Net::Whois Net::Whois исправлен парсинг дат, а также улучшен парсинг whois сервера GoDaddy
  • SE::Google::Trends SE::Google::Trends - полностью обновлен парсер и список собираемых значений
  • Rank::LinkPad Rank::LinkPad, Rank::MajesticSEO Rank::MajesticSEO, SE::Seznam SE::Seznam
Исправления
  • Проблема с прокруткой в Планировщике
  • Проблема с кодировкой в tools.parseJSON
  • Ошибка импорта JavaScript парсеров
 
Зачетная обнова - спасибо. А кинопоиск и imdb можете добавить?
 
Во вкладке "Инструменты - Тестирование шаблонов" для проекта "Rank::OpenSiteExplorer::Extended" отсутствует пример json. Из-за этого, не могу разобраться как вызывать все эти 39 параметров, про которые сказано выше.
 
В улучшениях этой версии есть строка "В парсере
se-yandex.png
SE::Yandex добавлен сбор времени последнего кэширования страницы". А возможно ли такое прикрутить для парсера Гугла?
 
гугл не выдает такой информации в выдаче
 
гугл не выдает такой информации в выдаче
Согласен. Только он выдает эту инфу с оператором cache. К примеру: cache:a-parser.com
Как вытянуть дату кеширования по этому запросу я ума не приложу. Если невозможно прикрутить дату кеша в Гугле как переменную, то подскажите пожалуйста как это сделать регуляркой.
 
Назад
Верх