1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Способы узнать есть ли на сайте форум?

Тема в разделе "Делимся опытом", создана пользователем fri-lancer, 5 июл 2018.

  1. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Только парсить код страницы и проверять есть ли слово форум в нем?
    Хотя может быть написано наш форум, форумы, вход на форум и т.д...
    Или же есть другие варианты?
     
  2. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Спасибо поддержке за помощь, выдали такой сниппет:
    [​IMG] download.png
    Код:
    eJyNVNty2jAQ/ZWOJjNpZxgIl0xbv9FM6WVoSBPyBDwIew0qQnIlmUCp/70rybZM
    GqZ9kbVHq70cHe+RGKo3+k6BBqNJNDuSzO1JROb51aD7zq79t27tuXXp1mu3Urde
    2XUAr9xn4CBwe3/Qd0js9kvSIhlVGpRNNiOfp9/GUTRmYvNxbxSNjVTokUBKc25I
    60jMIQOsRe5AKZYAHrIE7VxDpuT+gPaO8hxdUso1FOFGyrgBGwzbsbGiGWHCcMyk
    EaQiXmOqRav0m/pLCrbUxOsQ1ZHQO9vTb8fRoMGCZyrxzbr9+3/wgslkZpgUmI2R
    4nzPqVRYXdlOqPCiaqvtHV5fXlhzPheXb5rhcsF+5nCOEPu1dHivkg5tFBMrUqGf
    uFxSTiKjcigWiyqSHrm8tpSs2y7lUx8+0B1MpX+QkF2P0Lql24riQS+oatD1iOOt
    nwbGPHv9putVU4b/IcAqRNvsbY00SZilnnLfgxVl6OvRMxYRIdEXt4qBHim5RciA
    C2DBQ9X/jFw4O/D43d8p1dkiGskYUWw9eX7CUIQU1T9xUkD8SKQYcj6GHfDg5uJ/
    yBlP8A8apnjpS3nxZZfJXzGKur1mKpTak8IaglMix3JV9b4ByGo2bi2ylQrqAGXm
    Mi4OkwyEVWx47mEWoJMCTwg/BWMpUraalH9B5ZmLKU6sibiR24yDrVjknLfsRLgP
    0hrqkmBrhAKfX75xKbCseuIQIyXXXx98qZliKN1rW+AWOWpmLUPGlPPH+3HzhASx
    oLE2Jos6nad42VZ5Zy5KGyOv5a8AacTMTh40TSxIbGQDK4lqwr6LRT0261F9fHF4
    RscCH++HvvPetn3rixjyqN2U6RZ/ADRwAhE=
    Но он извлекает не все форумы, например на этих сайтах есть форумы но парсер их не видит:
    http://wcb.ru/
    http://prihoz.ru/
    https://tvoysad.ru/
    В исходном коде этих сайтов такое:
    Код:
    <a href="http://dacha.wcb.ru/" class="fmenu">Дачный форум</a>
    <a href='http://forum.prihoz.ru/' title='Форум' class='leftMenu' target="_blank" style="height:30px;"><span>Форум</span><div>08</div></a
    <a title="фоум садоводов и цветоводов" target="_blank" href="https://forum.tvoysad.ru/">Форум садоводов</a>
    Может нужно сделать какую то регулярку?
     
  3. Vvtex

    Vvtex A-Parser Pro License
    A-Parser Pro

    Регистрация:
    9 окт 2017
    Сообщения:
    124
    Симпатии:
    24
    Форум садоводов хотите найти? или что

    Форум|Дачный форум|Форум садоводов
     
  4. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Хочу найти ссылки на форум
    http://dacha.wcb.ru/
    http://forum.prihoz.ru/
    https://forum.tvoysad.ru/
    Не ходить же по каждому сайту и смотреть как там прописана ссылка на форум, должно же быть какое то решение
     
    #4 fri-lancer, 20 июл 2018
    Последнее редактирование модератором: 23 июл 2018
  5. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.558
    Симпатии:
    2.167
    Включите опцию Subdomains are internal, т.к. по-умолчанию она отключена и эти ссылки не попадают в $intlinks
     
    fri-lancer нравится это.
  6. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Теперь лишнее собирает :) http://prntscr.com/k8s3ha
    Если например ввести такой запрос http://www.luckyforum.net/index.php
    То соберет это
    Код:
    http://www.luckyforum.net/forumdisplay.php?f=11
    http://www.luckyforum.net/forumdisplay.php?f=14
    http://www.luckyforum.net/forumdisplay.php?f=37
    http://www.luckyforum.net/forumdisplay.php?f=31
    http://www.luckyforum.net/forumdisplay.php?f=32
    http://www.luckyforum.net/showthread.php?goto=newpost&t=71
    http://www.luckyforum.net/showgroups.php
    http://www.luckyforum.net/online.php
     
    #6 fri-lancer, 20 июл 2018
    Последнее редактирование модератором: 23 июл 2018
  7. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.558
    Симпатии:
    2.167
    Проверяйте по каких признаках эти результаты попадают в результат и исправляйте регулярку в фильтре так, что бы получать только то, что нужно.
     
    fri-lancer нравится это.
  8. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Подскажите как в этом задании можно исключить результаты со строками
    /online/
    /help/
    /threads/

    download.png
     
  9. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.558
    Симпатии:
    2.167
    Фильтруйте $inlinks.$i.link по регулярке /(?:online|help|threads)/
     
  10. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Что то не помогло
    download.png
     
  11. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.558
    Симпатии:
    2.167
    Если вам эти ссылки не нужны в результате, то нужно выбирать тип Регулярка не совпадает.
    https://a-parser.com/wiki/filter/
     
    fri-lancer нравится это.
  12. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    А ссылки извлекаются только в теге a?
    Такое не хочет искать
    <li><a href="http://kalina-club.com.ua/forum/
    " title="Официальный форум Лада Калина Клуба" alt="Официальный форум Лада Калина Клуба" ><b>ФОРУМ </b></a></li>
     
    #12 fri-lancer, 20 июл 2018
    Последнее редактирование модератором: 23 июл 2018
  13. Vvtex

    Vvtex A-Parser Pro License
    A-Parser Pro

    Регистрация:
    9 окт 2017
    Сообщения:
    124
    Симпатии:
    24
    т.е. по сути вам надо загрузить страницу и найти конкретные признаки, потом её сохранить, не попавшие по условиям страницы не сохраняются?
     
    #13 Vvtex, 21 июл 2018
    Последнее редактирование модератором: 23 июл 2018
  14. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Получается что не сохраняются
     
  15. Vvtex

    Vvtex A-Parser Pro License
    A-Parser Pro

    Регистрация:
    9 окт 2017
    Сообщения:
    124
    Симпатии:
    24
  16. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.558
    Симпатии:
    2.167
    Да, HTML::LinkExtractor HTML::LinkExtractor сохраняет ссылки из тегов <a>
    Скиньте ссылку на страницу, где не забирает все ссылки
     
  17. Vvtex

    Vvtex A-Parser Pro License
    A-Parser Pro

    Регистрация:
    9 окт 2017
    Сообщения:
    124
    Симпатии:
    24
  18. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Выше ссылка http://kalina-club.com.ua/ ссылку на форум не извлекает.
     
  19. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.558
    Симпатии:
    2.167
    [​IMG]
     
  20. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Паршу тем пресетом что дала поддержка, результата нету:
    123.png

    Мне нужны ссылки только на форумы
     

Поделиться этой страницей