Парсинг социальной сети "Мой мир"

poiskspider

A-Parser Pro License
A-Parser Pro
Собственно вопрос в названии темы. Можно ли такое реализовать, если в Мой мир можно зайти только под логином своей почты?
 
Смотря что нужно парсить. Основная информация вроде доступна без авторизации и парсить ее скорее всего не сложно: Net::HTTP и регулярки.
А то, что требует авторизации - в теории можно парсить также, только подставив куки авторизации из браузера.
 
На практике все не так просто. То что нужно парсить не доступно без авторизации. А именно нужна такая последовательность действий:

Есть список групп в текстовом формате

С каждой группы нужно спарсить всех участников, а после с каждого участника забрать его email. вот с этого поля

moy_mir.jpg
 
Насчет парсинга участников групп - да, требуется авторизация. Как парсить с авторизацией - я выше написал:
подставив куки авторизации из браузера
Хотя там есть еще один способ. Если детально проанализировать процесс авторизации, то можно увидеть, что можно авторизоваться одним POST-запросом с редиректом на нужную страницу участников. И оттуда регуляркой уже их забирать.
А мейлы видны и без авторизации. Кстати, вроде бы имя пользователя в Мой мир и мейл - это одно и то же...
 
Назад
Верх