37-й сборник рецептов. В него вошли: парсер Twitter, который умеет собирать сообщения, их авторов и т.п.; JS парсер, в котором объединены поиск и скачивание картинок; а также 2 пресета для парсинга Telegram, которые демонстрируют возможности по сбору данных из публичных групп.
Парсер постов из Twitter
Публикуем парсер, который по ключевому слову парсит данные из сообщений в Twitter. Собираются имя и логин автора, текст сообщения, дата публикация, количество лайков, ответов и ретвитов. Есть возможность указать количество страниц для парсинга.
JS::ImagesFromSE
Ранее мы уже публиковали JavaScript парсер, в котором объединены парсинг выдачи ПС и парсинг текста со страниц. Теперь представляем вашему вниманию JS парсер, в котором объединены поиск и скачивание картинок.
Добавлен новый парсер Telegram::GroupScraper, который собирает из публичных групп в Telegram данные о сообщениях: текст, дата, автор, ссылки на фото и видео
Добавлен новый парсер Shop::eBay, который позволяет парсить поисковую выдачу на ebay.com
Изменения в парсерах Google:
Добавлена переменная $detected_geo, в которой содержится информация о геолокации
В связи с неактуальностью удалены опции:
Old desktop computer (IE6) в Device
Util::AntiGate preset
Use digit captcha
В SE::Yandex увеличено максимальное значение Pages count до 25
36-й сборник рецептов, в котором опубликованы парсер для проверки текстов на уникальность, парсер GitHub и парсер для получения информации о посещаемости сайтов. А также список обновленных пресетов из нашего Каталога.
Проверка текста на уникальность
Задача проверки текстов на уникальность является одной из самых частых для копирайтеров. Возможность осуществлять такую проверку предоставляют много ресурсов. И парсер для одного из таких сервисов опубликован по ссылке выше.
Парсер Github
Согласно Википедии, GitHub - это крупнейший веб-сервис для хостинга IT-проектов и их совместной разработки. Поэтому мы не могли обойти его стороной и публикуем парсер данных о репозиториях при поиске по ключевому слову на данном ресурсе.
В связи с Черной пятницей мы разыграли 5 лицензий на А-Парсер среди всех новых участников нашего telegram чата, которые присоединились к нему в период проведения акции. Результаты розыгрыша в видео:
1. 2 декабря 2019 в 12:00 мы зафиксируем новый состав участников чата и сформируем список новых участников, появившихся с момента старта акции
2. С помощью сервиса random.org мы выберем кандидатов для выигрыша для каждой из лицензии
3. Кандидаты будут разделены на основных(зеленые) и запасных(оранжевые), запасные кандидаты будут использованы в порядки их очереди
4. После определения всех кандидатов, мы свяжемся с основными для проверки на ботов и читеров, у каждого кандидата будет до 24 часов на контакт с нами
5. В случае отрицательной проверки - будет выбран следующий кандидат из запасных в порядке очереди, для него будет также проведена проверка
6. Все основные моменты розыгрыша мы запишем на видео и загрузим вместе с...