Как определить наличие контента в теле страницы и вывести в таблицу

  • Автор темы Автор темы Reset
  • Дата начала Дата начала

Reset

A-Parser Enterprise License
A-Parser Enterprise
Всем привет, недавно в чате возник вот такой вопрос

Вот я давно юзаю RankMath, но стал замечать у конкурентов только Yoast. Есть гипотеза, что какие-то поисковики дают преимуществу микроразметке, мета-тегам или ещё каким-то малозначимым вещам, которые создаются этими плагинами.
Просто взять 1000 ключей любых или по нишам, спарсить WP сайты с выдачи ТОП10 и посчитать какого плагина больше в ТОПах.

Получить ВП сайты можно из моего предыдущего материала https://a-parser.com/threads/8397/

А вот определить наличие контента в коде и вывести в таблицу можно используя парсер https://a-parser.com/docs/parsers/net-http

Мой пресет выглядит так

upload_2024-6-27_8-14-55.png

Вся магия происходит в (1), а именно

Код:
[% 

  //p1.data.match - ищет в коде вхождение указанной фразы, результат присваивается переменной
   isYoastSeo = (p1.data.match("<!-- This site is optimized with the Yoast SEO plugin") ? '1' : '0');
  isRankMath = (p1.data.match("<!-- Search Engine Optimization by Rank Math") ? '1' : '0');
 
 //результат выводим в CSV используя https://a-parser.com/docs/parsers/se-yandex-wordcraft#output-in-CSV-table
//также добавляем code в последнюю колонку, чтоб было понятно где парсер наткнулся на какую то ошибку, чтоб понять общий процент 
  tools.CSVline(query,isYoastSeo,isRankMath,code);
%]

Также в пресете прописан юзер-агент для актуального браузера, чтоб не получать 403 от простых систем защиты.

Результат выглядит так :
upload_2024-6-27_8-23-24.png

Код:
eJx1VAtv2jAQ/iue1QqQeIRqXaewaaIItlUtdIVumgiaPHKAh2OntkNLEf9954Qm
0IcUUO7x3Z2/++INtcwszbUGA9ZQf7yhcfpOfRrCjCXC0iqNmTagXXhM+2B9/9to
dI3+PGND7ToGxKgVaM1DwCAP0Z4pHTGLFbNCKyYSlzY+JiSQhHDzWzFjh6DIZ1KO
m/WQWVZHxHRRDuind7UaGS24IYZbwGSiYssj/gghued2QewCSFqADLsDEotkzmVA
K+QLKTVLxCclr1RpZX1umFxeMcS81WcITE8XpCuxBpBB1ohZriT5uyYOThz+1fLu
Z5USpt4Z/hSIL98loNfV4njVYoLqVIVQaSHoeEK3b1OXIOU1Nge5T9yVeuRCsMZp
3SPlX1yG6t6Q/og0vbrXIuj48L5FHtyfXvnNk7O6VyFfYbpUjROv6eHTJD2uYaYe
GmmUbieTKs32Y3rpsrDLETK0k0EeHLIVjJRbKRdQuHto9VnkZrtIZO3k7I/3sYYP
DjQ1K8xjYcgdi0xk5Z2Kipa3kt+lB5MKcx1rHExPqwhdFh7szrl+Gm1Mj1KbYokk
xf7IMNSfMWGgSg3O2WM4Vfg8ghrSzCrtdqsk+jdUybYQl7ACUaSl9c8TLkKUfHuG
oO874Ospgxc1tvnx9lvheu81zpBXSa3zwVWBCtWlmj+RIVCAFm3TUYl0W/HQuQSI
c876Li1SGvI2VieQN8ePOgbppBTQ25vLgFYDmumxO0gNp8go1TQaHVRlQANZrLYd
7+D02YkPNnjonCo54/PBTspPmYkc4S0zkB0VxQIcBTIRouokflPIqG12G3NGztIL
cCdtcXA/pd/exTAbNdYcZXrqBoyQ9P2uu5JTJgQSsh9xQGNVPJBdrZ9tOtUQXVgb
G7/RYLXsNqxPVRTI3KvnrBax+aE3McyCsfgpxS5AXWsLc4X6RWK2k/xmze/fzd79
6m+2qIl/5jrLcay4DPQhvQYXTv3m9j/uRfN1
 
Назад
Верх