Парсинг Вконтакте

Пресет Парсер vk.com по параметрам. Как сделать? 2.0

Available for license holders
  • Автор темы Автор темы seewww
  • Дата начала Дата начала

seewww

A-Parser Pro License
A-Parser Pro
Ребят как такое на a parser'e сделать:

Парсим ссылки на анкеты vk.com
Потом на втором этапе проходим по этим ссылкам и парсим следующие данные: Родной город, Семейное положение, Время захода на анкету

Т.е в итоге получаем списком в таком виде данные:

Ссылка на анкету - Родной город - Семейное положение - Время захода на анкету
vk.com/id434444 - Москва - Не женат - Заходил вчера


Как такое сделать? И каким парсером? Насколько я понимаю это должен быть net.http

Буду очень благодарен за помощь.
 
Используем Net::HTTP + опцию Parse custom result чтобы с помощью регулярных выражений извлечь нужные данные:
u6Fg5.png


  • Задаем куку remixlang=0 указывающую на русский язык интерфейса
  • Задаем 3 регулярных выражения для города, семейного положения и времени последнего захода
  • Меняем формат результата чтобы вывести исходный запрос и спаршенные данные
  • В качестве запросов указываем диапазон анкет - первый миллион
В результате получаем файл с примерно следующим содержимым:
Код:
http://vk.com/id1492 - none - none - none
http://vk.com/id1485 - п. Сиверский - всё сложно - заходил 15 сентября в 1:34
http://vk.com/id1489 - Ленинград - none - Online
http://vk.com/id1481 - Санкт-Петербург - none - заходила 48 минут назад
http://vk.com/id1482 - град Поднебесный - не женат - Online
http://vk.com/id1493 - none - none - none

Средняя скорость парсинга с использованием прокси в 1000 потоков составляет 14000 анкет в минуту:
VGWoG.png


Код:
eyJwcmVzZXQiOiJWSyBQYXJzZXIiLCJ2YWx1ZSI6eyJwYXJzZXJzIjpbWyJOZXQ6
OkhUVFAiLCJkZWZhdWx0Iix7InR5cGUiOiJvdmVycmlkZSIsImlkIjoiY29va2ll
cyIsInZhbHVlIjoicmVtaXhsYW5nPTAifSx7InR5cGUiOiJjdXN0b21SZXN1bHQi
LCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiJcdTA0MjBcdTA0M2VcdTA0MzRcdTA0
M2RcdTA0M2VcdTA0MzkgXHUwNDMzXHUwNDNlXHUwNDQwXHUwNDNlXHUwNDM0Oi4q
PzxhW14+XSo+KFtePF0rKSIsInJlZ2V4VHlwZSI6IiIsInJlc3VsdFR5cGUiOiJm
bGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJjaXR5Il19LHsidHlwZSI6
ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEiLCJyZWdleCI6Ilx1MDQyMVx1
MDQzNVx1MDQzY1x1MDQzNVx1MDQzOVx1MDQzZFx1MDQzZVx1MDQzNSBcdTA0M2Zc
dTA0M2VcdTA0M2JcdTA0M2VcdTA0MzZcdTA0MzVcdTA0M2RcdTA0MzhcdTA0MzU6
PFxcL2Rpdj5cXG4gIDxkaXZbXj5dKj4oPzo8YVtePl0rPik/KFtePF0rKSIsInJl
Z2V4VHlwZSI6IiIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwi
cmVzdWx0cyI6WyJzdGF0dXMiXX0seyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVz
dWx0IjoiZGF0YSIsInJlZ2V4IjoiPGIgaWQ9XCJwcm9maWxlX1thLXpdKl9sdlwi
IGNsYXNzPVwiZmxfclwiPihbXjxdKykiLCJyZWdleFR5cGUiOiIiLCJyZXN1bHRU
eXBlIjoiZmxhdCIsImFycmF5TmFtZSI6IiIsInJlc3VsdHMiOlsibGFzdHNlZW4i
XX0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6ImZvcm1hdHJlc3VsdCIsInZhbHVl
IjoiJHF1ZXJ5IC0gJGNpdHkgLSAkc3RhdHVzIC0gJGxhc3RzZWVuXFxuIn1dXSwi
cmVzdWx0c0Zvcm1hdCI6IiRwMS5wcmVzZXQiLCJyZXN1bHRzU2F2ZVRvIjoiZmls
ZSIsInJlc3VsdHNGaWxlTmFtZSI6IiRkYXRlZmlsZS5mb3JtYXQoKS50eHQiLCJh
ZGRpdGlvbmFsRm9ybWF0cyI6W10sInJlc3VsdHNVbmlxdWUiOiJubyIsInF1ZXJ5
Rm9ybWF0IjoiJHF1ZXJ5IiwidW5pcXVlUXVlcmllcyI6ZmFsc2UsInNhdmVGYWls
ZWRRdWVyaWVzIjpmYWxzZSwiZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJObyIs
Im1vcmVPcHRpb25zIjpmYWxzZSwicmVzdWx0c1ByZXBlbmQiOiIiLCJyZXN1bHRz
QXBwZW5kIjoiIiwicXVlcnlCdWlsZGVycyI6W10sInJlc3VsdHNCdWlsZGVycyI6
W10sImNvbmZpZ092ZXJyaWRlcyI6W119fQ==
 
Forbidden огромнейшее человеческое спасибо.

Еще один вопрос, можешь подсказать как парсить именно анкеты с поиска?
Т.к мне не нужно все id перебирать, я хочу в качестве запроса использовать ссылку http://vk.com/search?c[bday]=5&c[bmonth]=5&c[byear]=1953&c[city]=1&c[country]=1&c[name]=1&c[photo]=1&c[section]=people&c[sex]=1

И перебирать с помощью диапазонов нужные даты рождения. Как там спарсить ссылки что бы были в виде vk.com/id4444 и т.п

А уже потом их я буду использовать в качестве запросов к парсингу инфы на анкетах
 
Последнее редактирование:
Сбор ссылок на анкеты
На вход используем ссылку на результаты поиска, например
Код:
http://vk.com/search?c%5Bbday%5D=5&c%5Bbmonth%5D=5&c%5Bbyear%5D=1953&c%5Bcity%5D=1&c%5Bcountry%5D=1&c%5Bname%5D=1&c%5Bphoto%5D=1&c%5Bsection%5D=people&c%5Bsex%5D=1

В результате получаем список ссылок на анкеты
Код:
http://vk.com/klavdia53
http://vk.com/id214800646
http://vk.com/id9480574
http://vk.com/id651224
http://vk.com/id90941285
http://vk.com/id255129010
http://vk.com/id180070301
http://vk.com/id172990813
http://vk.com/id172486596
http://vk.com/id83956353
http://vk.com/id81253801
http://vk.com/nadezda1953
http://vk.com/id214179445

vAhsG.png


Код:
eyJwcmVzZXQiOiJWSyBTZWFyY2ggUGFyc2VyIiwidmFsdWUiOnsicGFyc2VycyI6
W1siTmV0OjpIVFRQIiwiZGVmYXVsdCIseyJ0eXBlIjoiY3VzdG9tUmVzdWx0Iiwi
cmVzdWx0IjoiZGF0YSIsInJlZ2V4IjoiPGRpdiBjbGFzcz1cImxhYmVsZWQgbmFt
ZVwiPjxhIGhyZWY9XCIoLio/KVwiIiwicmVnZXhUeXBlIjoiZyIsInJlc3VsdFR5
cGUiOiJhcnJheSIsImFycmF5TmFtZSI6InBlb3BsZSIsInJlc3VsdHMiOlsiaWQi
XX0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6ImZvcm1hdHJlc3VsdCIsInZhbHVl
IjoiJHBlb3BsZS5mb3JtYXQoJ2h0dHA6Ly92ay5jb20kaWRcXG4nKSJ9XV0sInJl
c3VsdHNGb3JtYXQiOiIkcDEucHJlc2V0IiwicmVzdWx0c1NhdmVUbyI6ImZpbGUi
LCJyZXN1bHRzRmlsZU5hbWUiOiIkZGF0ZWZpbGUuZm9ybWF0KCkudHh0IiwiYWRk
aXRpb25hbEZvcm1hdHMiOltdLCJyZXN1bHRzVW5pcXVlIjoibm8iLCJxdWVyeUZv
cm1hdCI6IiRxdWVyeSIsInVuaXF1ZVF1ZXJpZXMiOmZhbHNlLCJzYXZlRmFpbGVk
UXVlcmllcyI6ZmFsc2UsImRvTG9nIjoibm8iLCJrZWVwVW5pcXVlIjoiTm8iLCJt
b3JlT3B0aW9ucyI6ZmFsc2UsInJlc3VsdHNQcmVwZW5kIjoiIiwicmVzdWx0c0Fw
cGVuZCI6IiIsInF1ZXJ5QnVpbGRlcnMiOltdLCJyZXN1bHRzQnVpbGRlcnMiOltd
LCJjb25maWdPdmVycmlkZXMiOltdfX0=
 
У меня то же вопрос по парсингу в ВК. Как сделать чтобы искал только по определенной стране или по определенному городу. Например вся Германия. или германия и город Берлин
 
У меня то же вопрос по парсингу в ВК. Как сделать чтобы искал только по определенной стране или по определенному городу. Например вся Германия. или германия и город Берлин

Необходимо просто сформировать ссылку в поиске контакта, например http://vk.com/search?c[country]=65&c[name]=1&c[photo]=1&c[section]=people
 
А как выпарсить все результаты со страницы результата поиска? Т.е результаты подгружаются только по мере скролинга.
 
Пример парсинга всех результатов поиска:

c8PSm.png


Код:
eyJwcmVzZXQiOiJWSyBTZWFyY2ggUGFyc2VyIiwidmFsdWUiOnsicHJlc2V0Ijoi
VksgU2VhcmNoIFBhcnNlciIsInBhcnNlcnMiOltbIk5ldDo6SFRUUCIsImRlZmF1
bHQiLHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6WyJwYWdlcyIsImRh
dGEiXSwicmVnZXgiOiI8ZGl2IGNsYXNzPVwibGFiZWxlZCBuYW1lXCI+PGEgaHJl
Zj1cIiguKj8pXCIiLCJyZWdleFR5cGUiOiJnIiwicmVzdWx0VHlwZSI6ImFycmF5
IiwiYXJyYXlOYW1lIjoicGVvcGxlIiwicmVzdWx0cyI6WyJpZCJdfSx7InR5cGUi
OiJvdmVycmlkZSIsImlkIjoiZm9ybWF0cmVzdWx0IiwidmFsdWUiOiIkcGVvcGxl
LmZvcm1hdCgnaHR0cDovL3ZrLmNvbSRpZFxcbicpIn0seyJ0eXBlIjoib3B0aW9u
cyIsImlkIjoiY2hlY2tOZXh0UGFnZSIsInZhbHVlIjoiPGEgY2xhc3M9XCJwZ19s
bmtfc2VsIGZsX2xcIiAuKj88L2E+PGEgY2xhc3M9XCJwZ19sbmsgZmxfbFwiIGhy
ZWY9XCIoW15cIl0rKVwiIn1dXSwicmVzdWx0c0Zvcm1hdCI6IiRwMS5wcmVzZXQi
LCJyZXN1bHRzU2F2ZVRvIjoiZmlsZSIsInJlc3VsdHNGaWxlTmFtZSI6IiRkYXRl
ZmlsZS5mb3JtYXQoKS50eHQiLCJhZGRpdGlvbmFsRm9ybWF0cyI6W10sInJlc3Vs
dHNVbmlxdWUiOiJubyIsInF1ZXJ5Rm9ybWF0IjpbIiRxdWVyeSJdLCJ1bmlxdWVR
dWVyaWVzIjpmYWxzZSwic2F2ZUZhaWxlZFF1ZXJpZXMiOmZhbHNlLCJpdGVyYXRv
ck9wdGlvbnMiOnsib25BbGxMZXZlbHMiOmZhbHNlfSwicmVzdWx0c09wdGlvbnMi
Onsib3ZlcndyaXRlIjpmYWxzZX0sImRvTG9nIjoibm8iLCJrZWVwVW5pcXVlIjoi
Tm8iLCJtb3JlT3B0aW9ucyI6ZmFsc2UsInJlc3VsdHNQcmVwZW5kIjoiIiwicmVz
dWx0c0FwcGVuZCI6IiIsInF1ZXJ5QnVpbGRlcnMiOltdLCJyZXN1bHRzQnVpbGRl
cnMiOltdLCJjb25maWdPdmVycmlkZXMiOltdfX0=
 
А как задать возможность парсить тех, кто сидит в вк с телефона?
 
А как задать возможность парсить тех, кто сидит в вк с телефона?

проанализировать HTML код страницы, выделить признаки на основе которых можно разделять тех кто сидит с телефона и на тех кто нет, составить регулярное выражение(или если признак простой то использовать его как строку) и добавить фильтр в парсере
 
Здравствуйте! Не работает пример выше, можно обновить? Есть ли возможность работать парсером с ВК, есть подробный мануал? Необходим поиск по ключу сообществ, парсинг контента групп, так же интересуют возможности работы A-Parser в данном направлении, что вообще он может в соцсетях с подробными примерами. Заранее спасибо.

https - работает, но все результаты в виде "https://vk.com/id*** - none - none - none".
Мне нужно спарсить из нужных групп участников, их институты, где учились, например. Литературы не хватает, вопрос остался. Хорошо, если есть в виде электронных книг.
 
Последнее редактирование:
Здравствуйте! Не работает пример выше, можно обновить? Есть ли возможность работать парсером с ВК, есть подробный мануал? Необходим поиск по ключу сообществ, парсинг контента групп, так же интересуют возможности работы A-Parser в данном направлении, что вообще он может в соцсетях с подробными примерами. Заранее спасибо.

https - работает, но все результаты в виде "https://vk.com/id*** - none - none - none".
Мне нужно спарсить из нужных групп участников, их институты, где учились, например. Литературы не хватает, вопрос остался. Хорошо, если есть в виде электронных книг.
какой литературы не хватает ? электронных книг по апарсеру ? o_O
по теме - вк сменил вёрстку, соответсвенно сменились регулярки. подстрой регулярки под новую вёрстку да и всё, там же всё расписано и интуитивно понятно...
подробный мануал по работе парсером с вк не существует, достаточно изучить парсер Net::HTTP, там ничего сложного нету.
вот пример, когда-то делал себе парсер контента с постов. чтобы не заморачиваться - сделал в экселе линки с постами по номерам от 1 до конечного в группе (например с https://vk.com/wall-345345_1 по https://vk.com/wall-345345_nnn) и вот такой пресет использовал:
eyJwcmVzZXQiOiJ2ayBwb3N0cyIsInZhbHVlIjp7InByZXNldCI6InZrIHBvc3Rz
IiwicGFyc2VycyI6W1siTmV0OjpIVFRQIiwibm9wcm94eSIseyJ0eXBlIjoiY3Vz
dG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0YSIsInJlZ2V4IjoiPGRpdiBjbGFzcz1c
IndhbGxfcG9zdF90ZXh0XCI+KC4qPyk8XFwvZGl2PjxcXC9kaXY+IiwicmVnZXhU
eXBlIjoiaSIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoicG9zdDEi
LCJyZXN1bHRzIjpbInBvc3RyIl19LHsidHlwZSI6Im92ZXJyaWRlIiwiaWQiOiJn
b29kQ29kZSIsInZhbHVlIjpbMjAwXX0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6
InByb3h5cmV0cmllcyIsInZhbHVlIjoiMTAwMCJ9LHsidHlwZSI6Im92ZXJyaWRl
IiwiaWQiOiJ0aW1lb3V0IiwidmFsdWUiOiIxNSJ9XV0sInJlc3VsdHNGb3JtYXQi
OiIkcDEucG9zdHIiLCJyZXN1bHRzU2F2ZVRvIjoiZmlsZSIsInJlc3VsdHNGaWxl
TmFtZSI6InZrL29rZWlnb29nbGUvJHtxdWVyeX0udHh0IiwiYWRkaXRpb25hbEZv
cm1hdHMiOltdLCJyZXN1bHRzVW5pcXVlIjoic3RyaW5nIiwicXVlcnlGb3JtYXQi
OlsiJHF1ZXJ5Il0sInVuaXF1ZVF1ZXJpZXMiOmZhbHNlLCJzYXZlRmFpbGVkUXVl
cmllcyI6ZmFsc2UsIml0ZXJhdG9yT3B0aW9ucyI6eyJvbkFsbExldmVscyI6ZmFs
c2UsInF1ZXJ5QnVpbGRlcnNBZnRlckl0ZXJhdG9yIjpmYWxzZSwicXVlcnlCdWls
ZGVyc09uQWxsTGV2ZWxzIjpmYWxzZX0sInJlc3VsdHNPcHRpb25zIjp7Im92ZXJ3
cml0ZSI6ZmFsc2V9LCJkb0xvZyI6Im5vIiwia2VlcFVuaXF1ZSI6Ik5vIiwibW9y
ZU9wdGlvbnMiOmZhbHNlLCJyZXN1bHRzUHJlcGVuZCI6IiIsInJlc3VsdHNBcHBl
bmQiOiIiLCJxdWVyeUJ1aWxkZXJzIjpbXSwicmVzdWx0c0J1aWxkZXJzIjpbXSwi
Y29uZmlnT3ZlcnJpZGVzIjpbXSwicnVuVGFza09uQ29tcGxldGUiOm51bGwsInVz
ZVJlc3VsdHNGaWxlQXNRdWVyaWVzRmlsZSI6ZmFsc2UsInJ1blRhc2tPbkNvbXBs
ZXRlQ29uZmlnIjoiZGVmYXVsdCIsInRvb2xzSlMiOiIifSwicGFyc2Vyc0NvbmZQ
cmVzZXRzIjp7Ik5ldDo6SFRUUCI6eyJub3Byb3h5Ijp7InVzZXItYWdlbnQiOiJN
b3ppbGxhLzUuMCAoV2luZG93cyBOVCA2LjE7IFdPVzY0OyBydjo0My4wKSBHZWNr
by8yMDEwMDEwMSBGaXJlZm94LzQzLjAiLCJxdWVyeWZvcm1hdCI6IiRxdWVyeSIs
ImhlYWRlcnMiOiIiLCJnb29kQ29kZVJlZ2V4IjoiWzI0NV1cXGRcXGQiLCJicm93
c2VyIjp0cnVlLCJnb29kQ29kZSI6WyIiXSwicHJveHlDaGVja2VyIjoiKiIsImRv
X2d6aXAiOnRydWUsImJvZHkiOiIiLCJ0aW1lb3V0IjoiMzAiLCJtYXhDb29raWVz
IjoiMTYiLCJtZXRob2QiOiJHRVQiLCJ1c2Vwcm94eSI6ZmFsc2UsIm9ubHloZWFk
ZXJzIjpmYWxzZSwiY29va2llcyI6IiIsInByb3h5cmV0cmllcyI6IjUiLCJyZXF1
ZXN0ZGVsYXkiOiIwIiwicHJveHliYW5uZWRjbGVhbnVwIjoiMzAwIiwiZm9ybWF0
cmVzdWx0IjoiJGNvZGUgJHJlYXNvblxcbiRoZWFkZXJzXFxuXFxuJGRhdGEiLCJk
ZXRlY3RjaGFyc2V0IjpmYWxzZSwicmVjdXJzZSI6IjEiLCJtYXhfc2l6ZSI6IjEw
NDg1NzYifX19fQ==
не знаю, работает ли он сейчас, после смены вёрстки, но если не работает - просто подправить регулярку нужно:
HTML:
<div class="wall_post_text">(.*?)<\/div><\/div>

точно так же и с другими примерами выше - подправляешь в нужных местах регулярки и всё работает. none говорит о том, что по регулярке ничего не нашло.
 
на институты например - вот тебе регулярка:
HTML:
<div class=\"labeled\"><a href=\"/search\?c\[name\]=\d{1,5}\&c\[section\]=people\&c\[uni_country\]=\d{1,10}\&c\[uni_city\]=\d{1,10}\&c\[university\]=\d{1,10}\">(.*)</a>
может где лишних экранирующих слешей наставил, но работать должно :)
 
Обновление пресета по сбору информации из профилей
WxUIW.png

Код:
eyJwcmVzZXQiOiJWSyBwYXJzZXIiLCJ2YWx1ZSI6eyJwcmVzZXQiOiJWSyBwYXJz
ZXIiLCJwYXJzZXJzIjpbWyJOZXQ6OkhUVFAiLCJkZWZhdWx0Iix7InR5cGUiOiJv
dmVycmlkZSIsImlkIjoiY29va2llcyIsInZhbHVlIjoicmVtaXhsYW5nPTAifSx7
InR5cGUiOiJvdmVycmlkZSIsImlkIjoidXNlci1hZ2VudCIsInZhbHVlIjoiTW96
aWxsYS81LjAgKFdpbmRvd3MgTlQgNi4xOyBXT1c2NCkgQXBwbGVXZWJLaXQvNTM3
LjM2IChLSFRNTCwgbGlrZSBHZWNrbykgQ2hyb21lLzU1LjAuMjg4My44NyBTYWZh
cmkvNTM3LjM2In0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6Imdvb2RDb2RlIiwi
dmFsdWUiOlsyMDBdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJk
YXRhIiwicmVnZXgiOiJcdTA0MjBcdTA0M2VcdTA0MzRcdTA0M2RcdTA0M2VcdTA0
MzkgXHUwNDMzXHUwNDNlXHUwNDQwXHUwNDNlXHUwNDM0OjxcXC9kaXY+XFxzKjxk
aXZbXj5dKj4oPzo8YVtePl0rPik/KFtePF0rKSIsInJlZ2V4VHlwZSI6IiIsInJl
c3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJjaXR5
Il19LHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEiLCJyZWdl
eCI6Ilx1MDQyMVx1MDQzNVx1MDQzY1x1MDQzNVx1MDQzOVx1MDQzZFx1MDQzZVx1
MDQzNSBcdTA0M2ZcdTA0M2VcdTA0M2JcdTA0M2VcdTA0MzZcdTA0MzVcdTA0M2Rc
dTA0MzhcdTA0MzU6PFxcL2Rpdj5cXHMqPGRpdltePl0qPig/OjxhW14+XSs+KT8o
Lis/KTxcXC9kaXY+IiwicmVnZXhUeXBlIjoiIiwicmVzdWx0VHlwZSI6ImZsYXQi
LCJhcnJheU5hbWUiOiIiLCJyZXN1bHRzIjpbInN0YXR1cyJdfSx7InR5cGUiOiJj
dXN0b21SZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiI8ZGl2IGlkPVwi
cHJvZmlsZV90aW1lX2x2XCI+KFtePF0rKSIsInJlZ2V4VHlwZSI6IiIsInJlc3Vs
dFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJsYXN0c2Vl
biJdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVn
ZXgiOiI8aDIgY2xhc3M9XCJwYWdlX25hbWVcIj4oW148XSspIiwicmVnZXhUeXBl
IjoiIiwicmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRz
IjpbIm5hbWUiXX0seyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0
YSIsInJlZ2V4IjoiXHUwNDFjXHUwNDNlXHUwNDMxXFwuIFx1MDQ0Mlx1MDQzNVx1
MDQzYlx1MDQzNVx1MDQ0NFx1MDQzZVx1MDQzZDo8XFwvZGl2Plxccyo8ZGl2W14+
XSo+KD86PGFbXj5dKz58PHNwYW4+KT8oW148XSspIiwicmVnZXhUeXBlIjoiIiwi
cmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRzIjpbInRl
bCJdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVn
ZXgiOiI8aW1nIGNsYXNzPVwicGFnZV9hdmF0YXJfaW1nXCIgc3JjPVwiKC4rPylc
IiIsInJlZ2V4VHlwZSI6IiIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1l
IjoiIiwicmVzdWx0cyI6WyJhdmF0YXIiXX0seyJ0eXBlIjoiZmlsdGVyIiwicmVz
dWx0IjoibmFtZSIsImZpbHRlclR5cGUiOiJub3RlcXVhbCIsInZhbHVlIjoibm9u
ZSIsIm9wdGlvbiI6InNlbnMifSx7InR5cGUiOiJvdmVycmlkZSIsImlkIjoicHJv
eHlyZXRyaWVzIiwidmFsdWUiOiIzMCJ9XV0sInJlc3VsdHNGb3JtYXQiOiJbJSBh
dmEgPSBwMS5hdmF0YXIubWF0Y2goJy9pbWFnZXMnKSA/ICdodHRwczovL3ZrLmNv
bScgXyBwMS5hdmF0YXIgOiBwMS5hdmF0YXIgLSVdXG4kcXVlcnk6ICRwMS5uYW1l
LCAkcDEubGFzdHNlZW4gLSAkcDEuY2l0eSwgJHAxLnN0YXR1cywgJHAxLnRlbCwg
JGF2YVxcbiIsInJlc3VsdHNTYXZlVG8iOiJmaWxlIiwicmVzdWx0c0ZpbGVOYW1l
IjoiJGRhdGVmaWxlLmZvcm1hdCgpLnR4dCIsImFkZGl0aW9uYWxGb3JtYXRzIjpb
XSwicmVzdWx0c1VuaXF1ZSI6Im5vIiwicXVlcmllc0Zyb20iOiJ0ZXh0IiwicXVl
cnlGb3JtYXQiOlsiJHF1ZXJ5Il0sInVuaXF1ZVF1ZXJpZXMiOmZhbHNlLCJzYXZl
RmFpbGVkUXVlcmllcyI6ZmFsc2UsIml0ZXJhdG9yT3B0aW9ucyI6eyJvbkFsbExl
dmVscyI6ZmFsc2UsInF1ZXJ5QnVpbGRlcnNBZnRlckl0ZXJhdG9yIjpmYWxzZSwi
cXVlcnlCdWlsZGVyc09uQWxsTGV2ZWxzIjpmYWxzZX0sInJlc3VsdHNPcHRpb25z
Ijp7Im92ZXJ3cml0ZSI6ZmFsc2V9LCJkb0xvZyI6Im5vIiwia2VlcFVuaXF1ZSI6
Ik5vIiwibW9yZU9wdGlvbnMiOmZhbHNlLCJyZXN1bHRzUHJlcGVuZCI6IiIsInJl
c3VsdHNBcHBlbmQiOiIiLCJxdWVyeUJ1aWxkZXJzIjpbXSwicmVzdWx0c0J1aWxk
ZXJzIjpbeyJzb3VyY2UiOlswLCJuYW1lIl0sInR5cGUiOiJkZWNvZGVIdG1sIiwi
dG8iOiJuYW1lIn0seyJzb3VyY2UiOlswLCJ0ZWwiXSwidHlwZSI6ImRlY29kZUh0
bWwiLCJ0byI6InRlbCJ9LHsic291cmNlIjpbMCwic3RhdHVzIl0sInR5cGUiOiJy
ZW1vdmVIdG1sIiwidG8iOiJzdGF0dXMifSx7InNvdXJjZSI6WzAsInN0YXR1cyJd
LCJ0eXBlIjoiZGVjb2RlSHRtbCIsInRvIjoic3RhdHVzIn0seyJzb3VyY2UiOlsw
LCJjaXR5Il0sInR5cGUiOiJkZWNvZGVIdG1sIiwidG8iOiJjaXR5In1dLCJjb25m
aWdPdmVycmlkZXMiOltdLCJydW5UYXNrT25Db21wbGV0ZSI6bnVsbCwidXNlUmVz
dWx0c0ZpbGVBc1F1ZXJpZXNGaWxlIjpmYWxzZSwicnVuVGFza09uQ29tcGxldGVD
b25maWciOiJkZWZhdWx0IiwidG9vbHNKUyI6IiIsInF1ZXJpZXMiOiJodHRwOi8v
dmsuY29tL2lke251bToxOjEwMDAwMDB9In19

Изменения
  • Обновлены регулярные выражения
  • Добавлен фильтр отсутствующих страниц
  • Добавлен вывод ФИО, телефона и аватара

Пример результата

http://vk.com/id242: Алексей Ёжиков, заходил 20 минут назад - Санкт-Петербург, влюблён в Ирину Шестопалову, +7 (921) 918-00-09, https://pp.vk.me/c623716/v623716242/4c110/aUZb0N4L0gY.jpg
http://vk.com/id51: Anna Linehan, none - none, none, none, https://vk.com/images/deactivated_200.gif
http://vk.com/id252: Сергей MixerS Микушев, заходил 7 декабря в 11:24 - СПб, женат на Нине Матвеевой, none, https://pp.vk.me/c14/u00252/a_318289c.jpg
http://vk.com/id219: Роман *RomaNTIC* Акамёлков, заходил сегодня в 0:18 - Хабаровск, не женат, Информация скрыта, https://pp.vk.me/c836425/v836425219/10429/t7GVykl7Cj4.jpg
http://vk.com/id270: Ирина Рыбакова, заходила сегодня в 14:05 - none, none, none, https://pp.vk.me/c629116/v629116270/14348/2g7P752u7XM.jpg

P.S. Аналогично можно парсить любую информацию со страниц, достаточно только добавить нужные регулярки.
 
Случаем ни у кого нет пресета по парсингу всех фото с альбома? Не могу разобраться с подгрузкой следующих фото.
 
А как спарсить именно сылки айди с определенной группы?
2a7b49956faa.png
 
В соседней теме есть готовый пример: https://a-parser.com/threads/2923/
это я видел,но как сделать так что бы например парсило с определенной группы как в примере,но результат был бы просто сылки на страницы,но с определенной группы.
пример:
http://vk.com/klavdia53
http://vk.com/id214800646
http://vk.com/id9480574
http://vk.com/id651224
http://vk.com/id90941285
http://vk.com/id255129010
http://vk.com/id180070301
http://vk.com/id172990813
http://vk.com/id172486596
http://vk.com/id83956353
http://vk.com/id81253801
http://vk.com/nadezda1953
http://vk.com/id214179445
196b418a7fc1.png
 
Назад
Верх