Многоуровневый парсинг.Парсим топ 10 и содержимого тегов title и description для этих сайтов

Пресет Многоуровневый парсинг.Парсим топ 10 и содержимого тегов title и description для этих сайтов 2.0

Доступно владельцам лицензии

Support Денис

A-Parser Enterprise License
A-Parser Enterprise
Пользователь Support Денис разместил новый ресурс:

Многоуровневый парсинг.Парсим топ 10 и содержимого тегов title и description для этих сайтов - Многоуровневый парсинг. Парсим топ 10 и содержимого тегов title и description для этих сайтов

Данный парсер собирает ТОП 10 из выдачи Google,Yandex,или Bing (на выбор), а затем собирает содержимое тегов title и description .
В качестве запросов подаем слова или совосочетания для поиска в поисковых системах.
На выходе получаем результат в формате домен сайта - title - description
Код:
www.av-test.org - AV-TEST | Antivirus & Security Software & AntiMalware Reviews - Provides independent comparative tests and reviews for antivirus software, antimalware tools, and security...

Узнать больше об этом ресурсе...
 
Заменил SE::Google:Modern на SE::Google в files/parsers/TOP10MultiThread/TOP10MultiThread.js
Не работает, Гугл показывает каптчу, как решить вопрос?
 
Создайте пресет настроек для нужного парсера и выберите его в настройках этого парсера.
tg1re_220405175852.png
 
(Данный парсер собирает ТОП 10, а затем собирает содержимое тегов title и description) Ага. ща )) Полученный мой результат не соответствует названию.
top10_.png
 
1) Это всего лишь простейший пример, модифицируйте его под свои задачи как угодно.
2) Ваш скриншот абсолютно неинформативен, т.к. вы запускаете задание с многоуровневым парсингом в Тесте задания, что не правильно, т.к. тут ограничено кол-во запросов. Нужно запускать на полное выполнение. Кроме того, видно что у вас было 2 неудачных, но логов по ним не видно.
3) Для более оперативной консультации лучше написать в Техническую поддержку: https://a-parser.com/pages/support/
 
К сожалению, парсер в результат выводит почему-то не более 4 доменов.
Мне нужно получить данные в таком формате: $query;$domain;$title;$description, формат я изменил.
Но в итоге в результате получается не более 4 доменов.
Пример:
правила поведения при терроризме;78.mchs.gov.ru;Правила поведения при террористическом акте - Пособия по безопасности среди населения - Главное управление МЧС России по г. Санкт-Петербургу;
правила поведения при терроризме;яндекс.справочника;;
правила поведения при терроризме;;;
правила поведения при терроризме;...;;
правила поведения при терроризме;fireman.club;Действия населения при угрозе теракта: правила поведения;Классификация терроризма. Признаки наличия и возможные места установки взрывных устройств. Как вести себя при перестрелке во время теракта и что делать, если оказался в заложниках
правила поведения при терроризме;;;
правила поведения при терроризме;;;
правила поведения при терроризме;;;
правила поведения при терроризме;nsportal.ru;"Терроризм. Я предупрежден." памятка для детей | Материал: | Образовательная социальная сеть;Памятка для детей при угрозе террористического акта.
правила поведения при терроризме;;;
правила поведения при терроризме;;;
правила поведения при терроризме;...;;
правила поведения при терроризме;www.admbal.ru;Действия населения при угрозе террористического акта;
правила поведения при терроризме;;;
И так вообще по всем разным кеям.
Подскажите, почему так и можно поправить?
ПС парсится Яндекс.
 
Пользователь Support Vladimir обновил ресурс Многоуровневый парсинг.Парсим топ 10 и содержимого тегов title и description для этих сайтов новой записью:

Исправления выдачи результатов

Исправлено:
1. Выдача и добавление запросов.
2. Регулярные выражения.
3. Способ получения ссылок.

Добавлено - опции для указания регулярных выражений, для получения заголовков, описаний.

nh823_221215204352.png


Для того, чтобы добавить несколько регулярных выражений нужно использовать распределитель (;;;) между ними.

Пример:
2mxlx_221215205852.png

Узнать больше об этом обновлении...
 
Назад
Верх