1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

A-Parser - парсер для профессионалов SEO

авг
08
by Forbidden at 17:20
(1.333 Просмотров / 0 Симпатии)
0 Комментарии
Большое количество исправлений, доводим парсер до идеального состояния!

А так же плановые фиксы в связи с изменением выдачи для SE::Google и [​IMG] SE::Yandex.

В следующих версиях ожидается новый HTTP движок, который не попал в текущую версию в связи с продолжительным тестированием.

Подробнее тут: 0.9.166
июл
08
by Forbidden at 17:17
(1.465 Просмотров / 0 Симпатии)
0 Комментарии
Добавлен парсер SE::QIP - парсер search.qip.ru, в нем выдача яндекса, парсит быстрее чем сам яндекс, меньше банит, а так же собирает до 5000 результатов с одного запроса

Добавлена поддержка выбора времени серпа(т.е. выбор времени когда проиндексирован результат) для гугла и яху, что позволяет например проверить сколько попало страниц в индекс за определенное время(час, день, неделя, и т.д.)

Поправлено большое число ошибок, спасибо вам, пользователям, за тестирование и сообщения о багах!

Подробнее тут: 0.9.38 и 0.9.57
июн
14
by Forbidden at 20:32
(1.476 Просмотров / 0 Симпатии)
0 Комментарии
Версия 0.9.16

[h2]Новые парсеры[/h2]
  • [​IMG] Net::DNS - парсер резолвит домены в IP адреса
  • [​IMG] SE::Google::SafeBrowsing - проверка домена в блеклисте гугла(подпись harm в выдачи)
  • [​IMG] SE::Google::Position - проверка позиции домена по ключевому слову в гугле
[h2]Новые возможности[/h2]
  • Подстановка найденных ключевых слов в качестве запросов для парсера [​IMG] SE::Yandex::WordStat, аналогично как сделанно для [​IMG] SE::Google::Suggests
  • Поддержка страниц для парсера [​IMG] Net::HTTP, теперь можно делать полноценные парсеры поисковых систем и т.п., пример для aol.com:...
июн
05
by Forbidden at 20:53
(1.618 Просмотров / 0 Симпатии)
0 Комментарии
Версия 0.9.4

Новый парсер [​IMG] Net::HTTP - просто скачивает указанную страницу и предоставляет следующие результаты:
  • {code} - код ответа
  • {reason} - описание ответа
  • {headers} - хёдеры
  • {data} - контент(страница)
Новый парсер [​IMG]HTML::LinkExtractor - собирает внутренние и внешние ссылки с указанной страницы, может ходить до определенного уровня по внутренним страницам сайта. С этим парсером можно составить карту сайта или собрать все внешние ссылки.

Еще один новый парсер - [​IMG] SE::Bing::LangDetect, позволяет определить язык сайта.

Самое важное улучшение - опция Parse custom result:
  • Позволяет применить регулярное выражение к любому результату любого парсера и сохранять новый результат с именованными макросами
  • Может парсить как простые результаты, так и массивы...
июн
01
by Forbidden at 17:47
(1.539 Просмотров / 0 Симпатии)
0 Комментарии
Версия 0.9

Новые возможности с фильтрацией результатов:

filter.png

Можно фильтровать по любому результату всех парсеров, вот основные примеры использования:
  • фильтровать ссылки с гугла по вхождению строки
  • фильтровать в резалт домены только с определенным PR
  • фильтровать кейворды Yandex WordStat только с определенным числом показов
Новая опция - парсить только уникальные запросы, очень хорошо сочитается с опциями использующими автоматические подстановки для парсинга всех возможных результатов, например:
SE::Google::Suggests - парсер подсказок с гугла + опция Parse to level: 10(парсить до 10 уровня) + Query format: {query} {a:zzzz} (подстановка дополнительных символов), парсим запрос cigarettes - получаем 106846 кея по сигаретам.

Новый макрос в имени файла результата:


Например парсим сниппеты по запросам viagra, cialis, levitra, результат по каждому кею будет сохранен в отдельный файл.

Остальные изменения можно посмотреть здесь:...