- English Name
- Content Downloader and A-Parser
- Минимальная версия A-Parser
- 1.2.37
Content Downloader и A-Parser
Обзор основных возможностей. В сегодняшнем обзоре сравним Content Downloader и A-Parser и попробуем дать оценку двум популярным продуктам в области парсинга.
Согласно определения разработчиков, Content Downloader - программа, предназначенная для парсинга любой информации с любых сайтов. Программа может применяться для:
Сравнение основных возможностей.
На первый взгляд, базовые возможности обоих программ очень похожи по определению. Например в части основного функционала и возможности задавать дополнительные параметры практически ничем не отличаются. К таким характеристикам можно отнести практически все пункты рассмотреные выше. Но реализация функционала как базового так и дополнительного имеет принципиальные отличия, которые определяют индивидуальность каждого решения в подходах к выполнению заданий.
В отличие от Content Downloader, в A-Parser уже есть набор готовых решений которые решают большую часть заданий связанных с парсингом популярных ресурсов. Наличие каталога парсеров и пресетов постоянно пополняется новыми примерами, которые поступаю от пользователей.
В части настройки и создания собственных парсеров, стоит отметить наличие намного большего количества параметров которые можно задавать через интерфейс в A-Parser, тогда как в Content Downloader задавать большую часть параметров нет возможности. К таким параметрам относятся:
В A-Parser, для создания собственных парсеров, существует возможность использовать язык программирования java script. Используя встроенные классы и методы можно создать собственный парсер по каким угодно критериям. Спарсить можно абсолютно любой ресур, используя как язык java script можно как отдельно так и с подключением отдельных, готовых парсеров - для получения результатов в собственный парсер. Это намного расширяет возможности по созданию собственных решений.
Что касается интеграции A-Parser в собственные бизнес-процесы, здесь предусмотрена поддержка API. Для обмена информацией A-Parser со своей собственно созданной системой, можно использовать один с популярных языков программирования (Perl, Python, PHP, Node.js). Ограничений нет абсолютно никаких, схема взаимодействия простая:
Обзор основных возможностей. В сегодняшнем обзоре сравним Content Downloader и A-Parser и попробуем дать оценку двум популярным продуктам в области парсинга.
Согласно определения разработчиков, Content Downloader - программа, предназначенная для парсинга любой информации с любых сайтов. Программа может применяться для:
- парсинга товаров интернет-магазина в таблицу CSV;
- парсинга статей с картинками и файлами в txt или htm форматы;
- парсинга телефонных номеров, e-mail адресов или любой другой контактной информации;
- парсинга скрытой информации, доступной после авторизации;
- парсинга любых частей кода WEB-документов и их вывод в нужном для вас формате;
- парсинга XML-карт сайтов;
- многопоточность;
- авторизация через передачу cookies из IE или через post-запрос;
- возможность задать cookies;
- возможность задавать user agent;
- загрузка файлов и картинок на ваш FTP-сервер при парсинге контента
- возможность отправки данных в базу MySQL при парсинге
- возможность подключения собственных PHP-скриптов для обработки данных при парсинге контента;
- предоставляет как готовые решение так и возможность создания собственных пресетов;
- возможность обработки собранных данных;
- экспортировать результаты в разные форматы;
- существует каталог парсеров и пресетов, который постоянно обновляется. В каталоге собраны индивидуальные решения по нестандартным задачам;
- возможность создавать свои собственные парсеры на основе регулярных выражений или Xpath;
- используя язык JavaScript есть возможность создания собственных сколько угодно сложных парсеров;
- существует поддержка API, позволяет легко встроить A-Parser в бизнес процессы
Сравнение основных возможностей.
На первый взгляд, базовые возможности обоих программ очень похожи по определению. Например в части основного функционала и возможности задавать дополнительные параметры практически ничем не отличаются. К таким характеристикам можно отнести практически все пункты рассмотреные выше. Но реализация функционала как базового так и дополнительного имеет принципиальные отличия, которые определяют индивидуальность каждого решения в подходах к выполнению заданий.
В отличие от Content Downloader, в A-Parser уже есть набор готовых решений которые решают большую часть заданий связанных с парсингом популярных ресурсов. Наличие каталога парсеров и пресетов постоянно пополняется новыми примерами, которые поступаю от пользователей.
В части настройки и создания собственных парсеров, стоит отметить наличие намного большего количества параметров которые можно задавать через интерфейс в A-Parser, тогда как в Content Downloader задавать большую часть параметров нет возможности. К таким параметрам относятся:
- возможность одновременного использования нескольких парсеров;
- возможность манипулировать параметрами запроса, через использования «конструктора запросов»;
- переопределения параметров парсера в каждом конкретном случаи;
- манипулировать представлением результатов через «конструктор результатов»;
- возможность индивидуального форматирования результатов, через «шаблонизатор» который встроен в парсер;
В A-Parser, для создания собственных парсеров, существует возможность использовать язык программирования java script. Используя встроенные классы и методы можно создать собственный парсер по каким угодно критериям. Спарсить можно абсолютно любой ресур, используя как язык java script можно как отдельно так и с подключением отдельных, готовых парсеров - для получения результатов в собственный парсер. Это намного расширяет возможности по созданию собственных решений.
Что касается интеграции A-Parser в собственные бизнес-процесы, здесь предусмотрена поддержка API. Для обмена информацией A-Parser со своей собственно созданной системой, можно использовать один с популярных языков программирования (Perl, Python, PHP, Node.js). Ограничений нет абсолютно никаких, схема взаимодействия простая:
- передаем в парсер входные данные
- парсер собирает информацию
- получаем ответ и используем его для своих целей