Сборник рецептов #23: категории сайтов, парсинг в YML и преобразование дат

Support · 28 май 2018

23-й сборник рецептов. В нем мы будем парсить категории сайтов из Google, научимся формировать файлы YML, а также разберемся, как парсить даты и преобразовывать их в единый формат. Поехали!

Получение категорий сайтов из Google
Категоризация сайтов - довольно актуальная задача, но существует немного сервисов, которые могут ее решить. Поэтому, по ссылке выше можно взять небольшой парсер, который позволяет получать категории сайтов из Google.

Выгрузка товаров в формате YML
YML - это стандарт, разработанный Яндексом для работы с Маркетом. По своей сути, это файлы, схожие с XML, в которых содержится информация о товарах в интернет-магазине. Данный формат обеспечивает регулярное автоматическое обновление каталога на Яндекс.Маркет и позволяет отражать все актуальные изменения (наличие, цена, появление новых товаров). Пример парсинга интернет-магазина и сохранения собранных данных в YML можно посмотреть по ссылке выше.

Парсим Google новости с датой и преобразуем ее
В поисковой выдаче Google возле новостей публикуется дата. Как правило, это могут быть метки "10 ч. назад" или "26 мая 2018 г.". Иногда может возникнуть задача спарсить все даты и привести их к единому виду. Как именно это сделать, можно узнать по ссылке выше.

Кроме этого:

Сохранение произвольных данных в сессиях - новый функционал по работе с сессиями

Сохранение больших файлов напрямую на диск - возможность сохранять файлы в JS парсерах напрямую, минуя шаблонизатор

Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Сборники рецептов:

Сборник рецептов #1: Определяем CMS, оцениваем частотность ключевых слов и парсим Вконтакте

Сборник рецептов #2: собираем форумы для XRumer, парсим email со страниц контактов

Сборник рецептов #3: мобильные сайты, несколько парсеров, позиции ключевых слов

Сборник рецептов #4: поиск в выдаче, парсинг интернет-магазина и скачиваем файлы

Сборник рецептов #5: ссылки из JS, паблик прокси и карта сайта

Сборник рецептов #6: парсим базу номеров телефонов и сохраняем результаты красиво

Сборник рецептов #7: парсим RSS, качаем картинки и фильтруем результат по заголовкам

Сборник рецептов #8: парсим 2GIS, Google translate и подсказки Youtube

Сборник рецептов #9: проверяем сезонность ключевых слов и их полезность

Сборник рецептов #10: пишем кастомный парсер поисковика и парсим дерево категорий

Сборник рецептов #11: парсим Авито, работаем с JavaScript, анализируем тексты и участвуем в акции!

Сборник рецептов #12: парсим Instagram, собираем статистику и делаем свои парсеры подсказок

Сборник рецептов #13: сохраняем результат в файл дампа SQL и знакомимся с $tools.query

Сборник рецептов #14: используем XPath, анализируем сайты и создаем комбинированные пресеты

Сборник рецептов #15: анализируем скорость и юзабилити сайтов, парсим Яндекс.Картинки и Baidu

Сборник рецептов #16: парсинг OpenSiteExplorer с авторизацией, Яндекс.Каталога и Яндекс.Новостей

Сборник рецептов #17: картинки из Flickr, язык ключевых слов, список лайков в ВК

Сборник рецептов #18: скриншоты сайтов, lite выдача Яндекса и проверка сайтов

Сборник рецептов #19: публикация сообщений в Wordpress, парсинг Chrome Webstore и AliExpress

Сборник рецептов #20: автообновление цен в ИМ, анализ текстов и регистрация аккаунтов

Сборник рецептов #21: уведомления в Telegram из A-Parser, мультифильтр и парсинг IMDb

Сборник рецептов #22: проверка индексации в нескольких ПС, многоуровневый парсинг и поиск сабдоменов

Сборник рецептов #23: категории сайтов, парсинг в YML и преобразование дат

Support Administrator
Команда форума A-Parser Enterprise

Поделиться этой страницей

О нас

Быстрая навигация

Twitter

Поддержка

Быстрый поиск

Сборник рецептов #23: категории сайтов, парсинг в YML и преобразование дат

Support Administrator Команда форума A-Parser Enterprise

Поделиться этой страницей

Служба поддержки

Support Administrator
Команда форума A-Parser Enterprise