1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2200+ и мы растем!
    Скрыть объявление

Нужна помощь в парсинге казино-блогов

Тема в разделе "Делимся опытом", создана пользователем Maxvell, 10 янв 2022.

  1. Maxvell

    Maxvell New Member

    Регистрация:
    6 янв 2022
    Сообщения:
    24
    Симпатии:
    1
    Как правильно настроить парсер на парсинг англоязычных казино-блогов через Google?
     

    Вложения:

  2. Maxvell

    Maxvell New Member

    Регистрация:
    6 янв 2022
    Сообщения:
    24
    Симпатии:
    1
    Здравствуйте, у меня получилось спарсить базу казино-ссылок с гугла.
    Теперь задача стоит в том как из этих ссылок достать блоги, тоесть как проверить эту базу на наличие казино-блогов?
    Если есть идеи буду очень благодарен.
     
    #2 Maxvell, 11 янв 2022
    Последнее редактирование: 11 янв 2022
  3. Maxvell

    Maxvell New Member

    Регистрация:
    6 янв 2022
    Сообщения:
    24
    Симпатии:
    1
    Сейчас занимаюсь парсингом блогов из 700к ссылок.

    Есть ли примеры пресетов для того чтобы выявить из 700к ссылок только блоги?
     
  4. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    3.919
    Симпатии:
    1.984
    Как вариант, нужно подготовить список признаков блогов в контенте страницы и проверить каждую ссылку на их наличие (это можно сделать с помощью Net::HTTP Net::HTTP и фильтров).
    Также, возможно полезным будет вариант фильтрации по CMS с помощью Rank::CMS Rank::CMS.
     
    Maxvell нравится это.
  5. Maxvell

    Maxvell New Member

    Регистрация:
    6 янв 2022
    Сообщения:
    24
    Симпатии:
    1
    Спасибо за помощь сейчас займусь!
     

Поделиться этой страницей