Ребят как такое на a parser'e сделать: Парсим ссылки на анкеты vk.com Потом на втором этапе проходим по этим ссылкам и парсим следующие данные: Родной город, Семейное положение, Время захода на анкету Т.е в итоге получаем списком в таком виде данные: Ссылка на анкету - Родной город - Семейное положение - Время захода на анкету vk.com/id434444 - Москва - Не женат - Заходил вчера Как такое сделать? И каким парсером? Насколько я понимаю это должен быть net.http Буду очень благодарен за помощь.
Используем Net::HTTP + опцию Parse custom result чтобы с помощью регулярных выражений извлечь нужные данные: Задаем куку remixlang=0 указывающую на русский язык интерфейса Задаем 3 регулярных выражения для города, семейного положения и времени последнего захода Меняем формат результата чтобы вывести исходный запрос и спаршенные данные В качестве запросов указываем диапазон анкет - первый миллион В результате получаем файл с примерно следующим содержимым: Код: http://vk.com/id1492 - none - none - none http://vk.com/id1485 - п. Сиверский - всё сложно - заходил 15 сентября в 1:34 http://vk.com/id1489 - Ленинград - none - Online http://vk.com/id1481 - Санкт-Петербург - none - заходила 48 минут назад http://vk.com/id1482 - град Поднебесный - не женат - Online http://vk.com/id1493 - none - none - none Средняя скорость парсинга с использованием прокси в 1000 потоков составляет 14000 анкет в минуту: Спойлер: Код задания для импорта Код: eyJwcmVzZXQiOiJWSyBQYXJzZXIiLCJ2YWx1ZSI6eyJwYXJzZXJzIjpbWyJOZXQ6 OkhUVFAiLCJkZWZhdWx0Iix7InR5cGUiOiJvdmVycmlkZSIsImlkIjoiY29va2ll cyIsInZhbHVlIjoicmVtaXhsYW5nPTAifSx7InR5cGUiOiJjdXN0b21SZXN1bHQi LCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiJcdTA0MjBcdTA0M2VcdTA0MzRcdTA0 M2RcdTA0M2VcdTA0MzkgXHUwNDMzXHUwNDNlXHUwNDQwXHUwNDNlXHUwNDM0Oi4q PzxhW14+XSo+KFtePF0rKSIsInJlZ2V4VHlwZSI6IiIsInJlc3VsdFR5cGUiOiJm bGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJjaXR5Il19LHsidHlwZSI6 ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEiLCJyZWdleCI6Ilx1MDQyMVx1 MDQzNVx1MDQzY1x1MDQzNVx1MDQzOVx1MDQzZFx1MDQzZVx1MDQzNSBcdTA0M2Zc dTA0M2VcdTA0M2JcdTA0M2VcdTA0MzZcdTA0MzVcdTA0M2RcdTA0MzhcdTA0MzU6 PFxcL2Rpdj5cXG4gIDxkaXZbXj5dKj4oPzo8YVtePl0rPik/KFtePF0rKSIsInJl Z2V4VHlwZSI6IiIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwi cmVzdWx0cyI6WyJzdGF0dXMiXX0seyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVz dWx0IjoiZGF0YSIsInJlZ2V4IjoiPGIgaWQ9XCJwcm9maWxlX1thLXpdKl9sdlwi IGNsYXNzPVwiZmxfclwiPihbXjxdKykiLCJyZWdleFR5cGUiOiIiLCJyZXN1bHRU eXBlIjoiZmxhdCIsImFycmF5TmFtZSI6IiIsInJlc3VsdHMiOlsibGFzdHNlZW4i XX0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6ImZvcm1hdHJlc3VsdCIsInZhbHVl IjoiJHF1ZXJ5IC0gJGNpdHkgLSAkc3RhdHVzIC0gJGxhc3RzZWVuXFxuIn1dXSwi cmVzdWx0c0Zvcm1hdCI6IiRwMS5wcmVzZXQiLCJyZXN1bHRzU2F2ZVRvIjoiZmls ZSIsInJlc3VsdHNGaWxlTmFtZSI6IiRkYXRlZmlsZS5mb3JtYXQoKS50eHQiLCJh ZGRpdGlvbmFsRm9ybWF0cyI6W10sInJlc3VsdHNVbmlxdWUiOiJubyIsInF1ZXJ5 Rm9ybWF0IjoiJHF1ZXJ5IiwidW5pcXVlUXVlcmllcyI6ZmFsc2UsInNhdmVGYWls ZWRRdWVyaWVzIjpmYWxzZSwiZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJObyIs Im1vcmVPcHRpb25zIjpmYWxzZSwicmVzdWx0c1ByZXBlbmQiOiIiLCJyZXN1bHRz QXBwZW5kIjoiIiwicXVlcnlCdWlsZGVycyI6W10sInJlc3VsdHNCdWlsZGVycyI6 W10sImNvbmZpZ092ZXJyaWRlcyI6W119fQ==
Forbidden огромнейшее человеческое спасибо. Еще один вопрос, можешь подсказать как парсить именно анкеты с поиска? Т.к мне не нужно все id перебирать, я хочу в качестве запроса использовать ссылку http://vk.com/search?c[bday]=5&c[bmonth]=5&c[byear]=1953&c[city]=1&c[country]=1&c[name]=1&c[photo]=1&c[section]=people&c[sex]=1 И перебирать с помощью диапазонов нужные даты рождения. Как там спарсить ссылки что бы были в виде vk.com/id4444 и т.п А уже потом их я буду использовать в качестве запросов к парсингу инфы на анкетах
Сбор ссылок на анкеты На вход используем ссылку на результаты поиска, например Код: http://vk.com/search?c%5Bbday%5D=5&c%5Bbmonth%5D=5&c%5Bbyear%5D=1953&c%5Bcity%5D=1&c%5Bcountry%5D=1&c%5Bname%5D=1&c%5Bphoto%5D=1&c%5Bsection%5D=people&c%5Bsex%5D=1 В результате получаем список ссылок на анкеты Код: http://vk.com/klavdia53 http://vk.com/id214800646 http://vk.com/id9480574 http://vk.com/id651224 http://vk.com/id90941285 http://vk.com/id255129010 http://vk.com/id180070301 http://vk.com/id172990813 http://vk.com/id172486596 http://vk.com/id83956353 http://vk.com/id81253801 http://vk.com/nadezda1953 http://vk.com/id214179445 Спойлер: Код задания для импорта Код: eyJwcmVzZXQiOiJWSyBTZWFyY2ggUGFyc2VyIiwidmFsdWUiOnsicGFyc2VycyI6 W1siTmV0OjpIVFRQIiwiZGVmYXVsdCIseyJ0eXBlIjoiY3VzdG9tUmVzdWx0Iiwi cmVzdWx0IjoiZGF0YSIsInJlZ2V4IjoiPGRpdiBjbGFzcz1cImxhYmVsZWQgbmFt ZVwiPjxhIGhyZWY9XCIoLio/KVwiIiwicmVnZXhUeXBlIjoiZyIsInJlc3VsdFR5 cGUiOiJhcnJheSIsImFycmF5TmFtZSI6InBlb3BsZSIsInJlc3VsdHMiOlsiaWQi XX0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6ImZvcm1hdHJlc3VsdCIsInZhbHVl IjoiJHBlb3BsZS5mb3JtYXQoJ2h0dHA6Ly92ay5jb20kaWRcXG4nKSJ9XV0sInJl c3VsdHNGb3JtYXQiOiIkcDEucHJlc2V0IiwicmVzdWx0c1NhdmVUbyI6ImZpbGUi LCJyZXN1bHRzRmlsZU5hbWUiOiIkZGF0ZWZpbGUuZm9ybWF0KCkudHh0IiwiYWRk aXRpb25hbEZvcm1hdHMiOltdLCJyZXN1bHRzVW5pcXVlIjoibm8iLCJxdWVyeUZv cm1hdCI6IiRxdWVyeSIsInVuaXF1ZVF1ZXJpZXMiOmZhbHNlLCJzYXZlRmFpbGVk UXVlcmllcyI6ZmFsc2UsImRvTG9nIjoibm8iLCJrZWVwVW5pcXVlIjoiTm8iLCJt b3JlT3B0aW9ucyI6ZmFsc2UsInJlc3VsdHNQcmVwZW5kIjoiIiwicmVzdWx0c0Fw cGVuZCI6IiIsInF1ZXJ5QnVpbGRlcnMiOltdLCJyZXN1bHRzQnVpbGRlcnMiOltd LCJjb25maWdPdmVycmlkZXMiOltdfX0=
У меня то же вопрос по парсингу в ВК. Как сделать чтобы искал только по определенной стране или по определенному городу. Например вся Германия. или германия и город Берлин
Необходимо просто сформировать ссылку в поиске контакта, например http://vk.com/search?c[country]=65&c[name]=1&c[photo]=1&c[section]=people
А как выпарсить все результаты со страницы результата поиска? Т.е результаты подгружаются только по мере скролинга.
Пример парсинга всех результатов поиска: Спойлер: Код пресета Код: eyJwcmVzZXQiOiJWSyBTZWFyY2ggUGFyc2VyIiwidmFsdWUiOnsicHJlc2V0Ijoi VksgU2VhcmNoIFBhcnNlciIsInBhcnNlcnMiOltbIk5ldDo6SFRUUCIsImRlZmF1 bHQiLHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6WyJwYWdlcyIsImRh dGEiXSwicmVnZXgiOiI8ZGl2IGNsYXNzPVwibGFiZWxlZCBuYW1lXCI+PGEgaHJl Zj1cIiguKj8pXCIiLCJyZWdleFR5cGUiOiJnIiwicmVzdWx0VHlwZSI6ImFycmF5 IiwiYXJyYXlOYW1lIjoicGVvcGxlIiwicmVzdWx0cyI6WyJpZCJdfSx7InR5cGUi OiJvdmVycmlkZSIsImlkIjoiZm9ybWF0cmVzdWx0IiwidmFsdWUiOiIkcGVvcGxl LmZvcm1hdCgnaHR0cDovL3ZrLmNvbSRpZFxcbicpIn0seyJ0eXBlIjoib3B0aW9u cyIsImlkIjoiY2hlY2tOZXh0UGFnZSIsInZhbHVlIjoiPGEgY2xhc3M9XCJwZ19s bmtfc2VsIGZsX2xcIiAuKj88L2E+PGEgY2xhc3M9XCJwZ19sbmsgZmxfbFwiIGhy ZWY9XCIoW15cIl0rKVwiIn1dXSwicmVzdWx0c0Zvcm1hdCI6IiRwMS5wcmVzZXQi LCJyZXN1bHRzU2F2ZVRvIjoiZmlsZSIsInJlc3VsdHNGaWxlTmFtZSI6IiRkYXRl ZmlsZS5mb3JtYXQoKS50eHQiLCJhZGRpdGlvbmFsRm9ybWF0cyI6W10sInJlc3Vs dHNVbmlxdWUiOiJubyIsInF1ZXJ5Rm9ybWF0IjpbIiRxdWVyeSJdLCJ1bmlxdWVR dWVyaWVzIjpmYWxzZSwic2F2ZUZhaWxlZFF1ZXJpZXMiOmZhbHNlLCJpdGVyYXRv ck9wdGlvbnMiOnsib25BbGxMZXZlbHMiOmZhbHNlfSwicmVzdWx0c09wdGlvbnMi Onsib3ZlcndyaXRlIjpmYWxzZX0sImRvTG9nIjoibm8iLCJrZWVwVW5pcXVlIjoi Tm8iLCJtb3JlT3B0aW9ucyI6ZmFsc2UsInJlc3VsdHNQcmVwZW5kIjoiIiwicmVz dWx0c0FwcGVuZCI6IiIsInF1ZXJ5QnVpbGRlcnMiOltdLCJyZXN1bHRzQnVpbGRl cnMiOltdLCJjb25maWdPdmVycmlkZXMiOltdfX0=
проанализировать HTML код страницы, выделить признаки на основе которых можно разделять тех кто сидит с телефона и на тех кто нет, составить регулярное выражение(или если признак простой то использовать его как строку) и добавить фильтр в парсере
Здравствуйте! Не работает пример выше, можно обновить? Есть ли возможность работать парсером с ВК, есть подробный мануал? Необходим поиск по ключу сообществ, парсинг контента групп, так же интересуют возможности работы A-Parser в данном направлении, что вообще он может в соцсетях с подробными примерами. Заранее спасибо. https - работает, но все результаты в виде "https://vk.com/id*** - none - none - none". Мне нужно спарсить из нужных групп участников, их институты, где учились, например. Литературы не хватает, вопрос остался. Хорошо, если есть в виде электронных книг.
какой литературы не хватает ? электронных книг по апарсеру ? по теме - вк сменил вёрстку, соответсвенно сменились регулярки. подстрой регулярки под новую вёрстку да и всё, там же всё расписано и интуитивно понятно... подробный мануал по работе парсером с вк не существует, достаточно изучить парсер Net::HTTP, там ничего сложного нету. вот пример, когда-то делал себе парсер контента с постов. чтобы не заморачиваться - сделал в экселе линки с постами по номерам от 1 до конечного в группе (например с https://vk.com/wall-345345_1 по https://vk.com/wall-345345_nnn) и вот такой пресет использовал: Спойлер: парсинг контента с постов eyJwcmVzZXQiOiJ2ayBwb3N0cyIsInZhbHVlIjp7InByZXNldCI6InZrIHBvc3Rz IiwicGFyc2VycyI6W1siTmV0OjpIVFRQIiwibm9wcm94eSIseyJ0eXBlIjoiY3Vz dG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0YSIsInJlZ2V4IjoiPGRpdiBjbGFzcz1c IndhbGxfcG9zdF90ZXh0XCI+KC4qPyk8XFwvZGl2PjxcXC9kaXY+IiwicmVnZXhU eXBlIjoiaSIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoicG9zdDEi LCJyZXN1bHRzIjpbInBvc3RyIl19LHsidHlwZSI6Im92ZXJyaWRlIiwiaWQiOiJn b29kQ29kZSIsInZhbHVlIjpbMjAwXX0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6 InByb3h5cmV0cmllcyIsInZhbHVlIjoiMTAwMCJ9LHsidHlwZSI6Im92ZXJyaWRl IiwiaWQiOiJ0aW1lb3V0IiwidmFsdWUiOiIxNSJ9XV0sInJlc3VsdHNGb3JtYXQi OiIkcDEucG9zdHIiLCJyZXN1bHRzU2F2ZVRvIjoiZmlsZSIsInJlc3VsdHNGaWxl TmFtZSI6InZrL29rZWlnb29nbGUvJHtxdWVyeX0udHh0IiwiYWRkaXRpb25hbEZv cm1hdHMiOltdLCJyZXN1bHRzVW5pcXVlIjoic3RyaW5nIiwicXVlcnlGb3JtYXQi OlsiJHF1ZXJ5Il0sInVuaXF1ZVF1ZXJpZXMiOmZhbHNlLCJzYXZlRmFpbGVkUXVl cmllcyI6ZmFsc2UsIml0ZXJhdG9yT3B0aW9ucyI6eyJvbkFsbExldmVscyI6ZmFs c2UsInF1ZXJ5QnVpbGRlcnNBZnRlckl0ZXJhdG9yIjpmYWxzZSwicXVlcnlCdWls ZGVyc09uQWxsTGV2ZWxzIjpmYWxzZX0sInJlc3VsdHNPcHRpb25zIjp7Im92ZXJ3 cml0ZSI6ZmFsc2V9LCJkb0xvZyI6Im5vIiwia2VlcFVuaXF1ZSI6Ik5vIiwibW9y ZU9wdGlvbnMiOmZhbHNlLCJyZXN1bHRzUHJlcGVuZCI6IiIsInJlc3VsdHNBcHBl bmQiOiIiLCJxdWVyeUJ1aWxkZXJzIjpbXSwicmVzdWx0c0J1aWxkZXJzIjpbXSwi Y29uZmlnT3ZlcnJpZGVzIjpbXSwicnVuVGFza09uQ29tcGxldGUiOm51bGwsInVz ZVJlc3VsdHNGaWxlQXNRdWVyaWVzRmlsZSI6ZmFsc2UsInJ1blRhc2tPbkNvbXBs ZXRlQ29uZmlnIjoiZGVmYXVsdCIsInRvb2xzSlMiOiIifSwicGFyc2Vyc0NvbmZQ cmVzZXRzIjp7Ik5ldDo6SFRUUCI6eyJub3Byb3h5Ijp7InVzZXItYWdlbnQiOiJN b3ppbGxhLzUuMCAoV2luZG93cyBOVCA2LjE7IFdPVzY0OyBydjo0My4wKSBHZWNr by8yMDEwMDEwMSBGaXJlZm94LzQzLjAiLCJxdWVyeWZvcm1hdCI6IiRxdWVyeSIs ImhlYWRlcnMiOiIiLCJnb29kQ29kZVJlZ2V4IjoiWzI0NV1cXGRcXGQiLCJicm93 c2VyIjp0cnVlLCJnb29kQ29kZSI6WyIiXSwicHJveHlDaGVja2VyIjoiKiIsImRv X2d6aXAiOnRydWUsImJvZHkiOiIiLCJ0aW1lb3V0IjoiMzAiLCJtYXhDb29raWVz IjoiMTYiLCJtZXRob2QiOiJHRVQiLCJ1c2Vwcm94eSI6ZmFsc2UsIm9ubHloZWFk ZXJzIjpmYWxzZSwiY29va2llcyI6IiIsInByb3h5cmV0cmllcyI6IjUiLCJyZXF1 ZXN0ZGVsYXkiOiIwIiwicHJveHliYW5uZWRjbGVhbnVwIjoiMzAwIiwiZm9ybWF0 cmVzdWx0IjoiJGNvZGUgJHJlYXNvblxcbiRoZWFkZXJzXFxuXFxuJGRhdGEiLCJk ZXRlY3RjaGFyc2V0IjpmYWxzZSwicmVjdXJzZSI6IjEiLCJtYXhfc2l6ZSI6IjEw NDg1NzYifX19fQ== не знаю, работает ли он сейчас, после смены вёрстки, но если не работает - просто подправить регулярку нужно: HTML: <div class="wall_post_text">(.*?)<\/div><\/div> точно так же и с другими примерами выше - подправляешь в нужных местах регулярки и всё работает. none говорит о том, что по регулярке ничего не нашло.
на институты например - вот тебе регулярка: HTML: <div class=\"labeled\"><a href=\"/search\?c\[name\]=\d{1,5}\&c\[section\]=people\&c\[uni_country\]=\d{1,10}\&c\[uni_city\]=\d{1,10}\&c\[university\]=\d{1,10}\">(.*)</a> может где лишних экранирующих слешей наставил, но работать должно
Обновление пресета по сбору информации из профилей Спойлер: Пресет Код: eyJwcmVzZXQiOiJWSyBwYXJzZXIiLCJ2YWx1ZSI6eyJwcmVzZXQiOiJWSyBwYXJz ZXIiLCJwYXJzZXJzIjpbWyJOZXQ6OkhUVFAiLCJkZWZhdWx0Iix7InR5cGUiOiJv dmVycmlkZSIsImlkIjoiY29va2llcyIsInZhbHVlIjoicmVtaXhsYW5nPTAifSx7 InR5cGUiOiJvdmVycmlkZSIsImlkIjoidXNlci1hZ2VudCIsInZhbHVlIjoiTW96 aWxsYS81LjAgKFdpbmRvd3MgTlQgNi4xOyBXT1c2NCkgQXBwbGVXZWJLaXQvNTM3 LjM2IChLSFRNTCwgbGlrZSBHZWNrbykgQ2hyb21lLzU1LjAuMjg4My44NyBTYWZh cmkvNTM3LjM2In0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6Imdvb2RDb2RlIiwi dmFsdWUiOlsyMDBdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJk YXRhIiwicmVnZXgiOiJcdTA0MjBcdTA0M2VcdTA0MzRcdTA0M2RcdTA0M2VcdTA0 MzkgXHUwNDMzXHUwNDNlXHUwNDQwXHUwNDNlXHUwNDM0OjxcXC9kaXY+XFxzKjxk aXZbXj5dKj4oPzo8YVtePl0rPik/KFtePF0rKSIsInJlZ2V4VHlwZSI6IiIsInJl c3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJjaXR5 Il19LHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEiLCJyZWdl eCI6Ilx1MDQyMVx1MDQzNVx1MDQzY1x1MDQzNVx1MDQzOVx1MDQzZFx1MDQzZVx1 MDQzNSBcdTA0M2ZcdTA0M2VcdTA0M2JcdTA0M2VcdTA0MzZcdTA0MzVcdTA0M2Rc dTA0MzhcdTA0MzU6PFxcL2Rpdj5cXHMqPGRpdltePl0qPig/OjxhW14+XSs+KT8o Lis/KTxcXC9kaXY+IiwicmVnZXhUeXBlIjoiIiwicmVzdWx0VHlwZSI6ImZsYXQi LCJhcnJheU5hbWUiOiIiLCJyZXN1bHRzIjpbInN0YXR1cyJdfSx7InR5cGUiOiJj dXN0b21SZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiI8ZGl2IGlkPVwi cHJvZmlsZV90aW1lX2x2XCI+KFtePF0rKSIsInJlZ2V4VHlwZSI6IiIsInJlc3Vs dFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJsYXN0c2Vl biJdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVn ZXgiOiI8aDIgY2xhc3M9XCJwYWdlX25hbWVcIj4oW148XSspIiwicmVnZXhUeXBl IjoiIiwicmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRz IjpbIm5hbWUiXX0seyJ0eXBlIjoiY3VzdG9tUmVzdWx0IiwicmVzdWx0IjoiZGF0 YSIsInJlZ2V4IjoiXHUwNDFjXHUwNDNlXHUwNDMxXFwuIFx1MDQ0Mlx1MDQzNVx1 MDQzYlx1MDQzNVx1MDQ0NFx1MDQzZVx1MDQzZDo8XFwvZGl2Plxccyo8ZGl2W14+ XSo+KD86PGFbXj5dKz58PHNwYW4+KT8oW148XSspIiwicmVnZXhUeXBlIjoiIiwi cmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRzIjpbInRl bCJdfSx7InR5cGUiOiJjdXN0b21SZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVn ZXgiOiI8aW1nIGNsYXNzPVwicGFnZV9hdmF0YXJfaW1nXCIgc3JjPVwiKC4rPylc IiIsInJlZ2V4VHlwZSI6IiIsInJlc3VsdFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1l IjoiIiwicmVzdWx0cyI6WyJhdmF0YXIiXX0seyJ0eXBlIjoiZmlsdGVyIiwicmVz dWx0IjoibmFtZSIsImZpbHRlclR5cGUiOiJub3RlcXVhbCIsInZhbHVlIjoibm9u ZSIsIm9wdGlvbiI6InNlbnMifSx7InR5cGUiOiJvdmVycmlkZSIsImlkIjoicHJv eHlyZXRyaWVzIiwidmFsdWUiOiIzMCJ9XV0sInJlc3VsdHNGb3JtYXQiOiJbJSBh dmEgPSBwMS5hdmF0YXIubWF0Y2goJy9pbWFnZXMnKSA/ICdodHRwczovL3ZrLmNv bScgXyBwMS5hdmF0YXIgOiBwMS5hdmF0YXIgLSVdXG4kcXVlcnk6ICRwMS5uYW1l LCAkcDEubGFzdHNlZW4gLSAkcDEuY2l0eSwgJHAxLnN0YXR1cywgJHAxLnRlbCwg JGF2YVxcbiIsInJlc3VsdHNTYXZlVG8iOiJmaWxlIiwicmVzdWx0c0ZpbGVOYW1l IjoiJGRhdGVmaWxlLmZvcm1hdCgpLnR4dCIsImFkZGl0aW9uYWxGb3JtYXRzIjpb XSwicmVzdWx0c1VuaXF1ZSI6Im5vIiwicXVlcmllc0Zyb20iOiJ0ZXh0IiwicXVl cnlGb3JtYXQiOlsiJHF1ZXJ5Il0sInVuaXF1ZVF1ZXJpZXMiOmZhbHNlLCJzYXZl RmFpbGVkUXVlcmllcyI6ZmFsc2UsIml0ZXJhdG9yT3B0aW9ucyI6eyJvbkFsbExl dmVscyI6ZmFsc2UsInF1ZXJ5QnVpbGRlcnNBZnRlckl0ZXJhdG9yIjpmYWxzZSwi cXVlcnlCdWlsZGVyc09uQWxsTGV2ZWxzIjpmYWxzZX0sInJlc3VsdHNPcHRpb25z Ijp7Im92ZXJ3cml0ZSI6ZmFsc2V9LCJkb0xvZyI6Im5vIiwia2VlcFVuaXF1ZSI6 Ik5vIiwibW9yZU9wdGlvbnMiOmZhbHNlLCJyZXN1bHRzUHJlcGVuZCI6IiIsInJl c3VsdHNBcHBlbmQiOiIiLCJxdWVyeUJ1aWxkZXJzIjpbXSwicmVzdWx0c0J1aWxk ZXJzIjpbeyJzb3VyY2UiOlswLCJuYW1lIl0sInR5cGUiOiJkZWNvZGVIdG1sIiwi dG8iOiJuYW1lIn0seyJzb3VyY2UiOlswLCJ0ZWwiXSwidHlwZSI6ImRlY29kZUh0 bWwiLCJ0byI6InRlbCJ9LHsic291cmNlIjpbMCwic3RhdHVzIl0sInR5cGUiOiJy ZW1vdmVIdG1sIiwidG8iOiJzdGF0dXMifSx7InNvdXJjZSI6WzAsInN0YXR1cyJd LCJ0eXBlIjoiZGVjb2RlSHRtbCIsInRvIjoic3RhdHVzIn0seyJzb3VyY2UiOlsw LCJjaXR5Il0sInR5cGUiOiJkZWNvZGVIdG1sIiwidG8iOiJjaXR5In1dLCJjb25m aWdPdmVycmlkZXMiOltdLCJydW5UYXNrT25Db21wbGV0ZSI6bnVsbCwidXNlUmVz dWx0c0ZpbGVBc1F1ZXJpZXNGaWxlIjpmYWxzZSwicnVuVGFza09uQ29tcGxldGVD b25maWciOiJkZWZhdWx0IiwidG9vbHNKUyI6IiIsInF1ZXJpZXMiOiJodHRwOi8v dmsuY29tL2lke251bToxOjEwMDAwMDB9In19 Изменения Обновлены регулярные выражения Добавлен фильтр отсутствующих страниц Добавлен вывод ФИО, телефона и аватара Пример результата P.S. Аналогично можно парсить любую информацию со страниц, достаточно только добавить нужные регулярки.
Случаем ни у кого нет пресета по парсингу всех фото с альбома? Не могу разобраться с подгрузкой следующих фото.
это я видел,но как сделать так что бы например парсило с определенной группы как в примере,но результат был бы просто сылки на страницы,но с определенной группы. пример: http://vk.com/klavdia53 http://vk.com/id214800646 http://vk.com/id9480574 http://vk.com/id651224 http://vk.com/id90941285 http://vk.com/id255129010 http://vk.com/id180070301 http://vk.com/id172990813 http://vk.com/id172486596 http://vk.com/id83956353 http://vk.com/id81253801 http://vk.com/nadezda1953 http://vk.com/id214179445