1. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Как определить наличие контента в теле страницы и вывести в таблицу

Тема в разделе "Делимся опытом", создана пользователем Reset, 27 июн 2024.

  1. Reset

    Reset A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    28 фев 2019
    Сообщения:
    25
    Симпатии:
    39
    Всем привет, недавно в чате возник вот такой вопрос

    Получить ВП сайты можно из моего предыдущего материала https://a-parser.com/threads/8397/

    А вот определить наличие контента в коде и вывести в таблицу можно используя парсер https://a-parser.com/docs/parsers/net-http

    Мой пресет выглядит так

    upload_2024-6-27_8-14-55.png

    Вся магия происходит в (1), а именно

    Код:
    [% 
    
      //p1.data.match - ищет в коде вхождение указанной фразы, результат присваивается переменной
       isYoastSeo = (p1.data.match("<!-- This site is optimized with the Yoast SEO plugin") ? '1' : '0');
      isRankMath = (p1.data.match("<!-- Search Engine Optimization by Rank Math") ? '1' : '0');
     
     //результат выводим в CSV используя https://a-parser.com/docs/parsers/se-yandex-wordcraft#output-in-CSV-table
    //также добавляем code в последнюю колонку, чтоб было понятно где парсер наткнулся на какую то ошибку, чтоб понять общий процент 
      tools.CSVline(query,isYoastSeo,isRankMath,code);
    %]
    Также в пресете прописан юзер-агент для актуального браузера, чтоб не получать 403 от простых систем защиты.

    Результат выглядит так :
    upload_2024-6-27_8-23-24.png

    Код:
    eJx1VAtv2jAQ/iue1QqQeIRqXaewaaIItlUtdIVumgiaPHKAh2OntkNLEf9954Qm
    0IcUUO7x3Z2/++INtcwszbUGA9ZQf7yhcfpOfRrCjCXC0iqNmTagXXhM+2B9/9to
    dI3+PGND7ToGxKgVaM1DwCAP0Z4pHTGLFbNCKyYSlzY+JiSQhHDzWzFjh6DIZ1KO
    m/WQWVZHxHRRDuind7UaGS24IYZbwGSiYssj/gghued2QewCSFqADLsDEotkzmVA
    K+QLKTVLxCclr1RpZX1umFxeMcS81WcITE8XpCuxBpBB1ohZriT5uyYOThz+1fLu
    Z5USpt4Z/hSIL98loNfV4njVYoLqVIVQaSHoeEK3b1OXIOU1Nge5T9yVeuRCsMZp
    3SPlX1yG6t6Q/og0vbrXIuj48L5FHtyfXvnNk7O6VyFfYbpUjROv6eHTJD2uYaYe
    GmmUbieTKs32Y3rpsrDLETK0k0EeHLIVjJRbKRdQuHto9VnkZrtIZO3k7I/3sYYP
    DjQ1K8xjYcgdi0xk5Z2Kipa3kt+lB5MKcx1rHExPqwhdFh7szrl+Gm1Mj1KbYokk
    xf7IMNSfMWGgSg3O2WM4Vfg8ghrSzCrtdqsk+jdUybYQl7ACUaSl9c8TLkKUfHuG
    oO874Ospgxc1tvnx9lvheu81zpBXSa3zwVWBCtWlmj+RIVCAFm3TUYl0W/HQuQSI
    c876Li1SGvI2VieQN8ePOgbppBTQ25vLgFYDmumxO0gNp8go1TQaHVRlQANZrLYd
    7+D02YkPNnjonCo54/PBTspPmYkc4S0zkB0VxQIcBTIRouokflPIqG12G3NGztIL
    cCdtcXA/pd/exTAbNdYcZXrqBoyQ9P2uu5JTJgQSsh9xQGNVPJBdrZ9tOtUQXVgb
    G7/RYLXsNqxPVRTI3KvnrBax+aE3McyCsfgpxS5AXWsLc4X6RWK2k/xmze/fzd79
    6m+2qIl/5jrLcay4DPQhvQYXTv3m9j/uRfN1
     
    Petr_G, d4k, Forbidden и ещё 1-му нравится это.

Поделиться этой страницей