Сборник рецептов #11: парсим Авито, работаем с JavaScript, анализируем тексты и участвуем в акции!

Тема в разделе "Новости", создана пользователем Forbidden, 2 ноя 2015.

  1. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.093
    Симпатии:
    1.639
    Розыгрыш призов, условия акции смотри в конце!

    11-й выпуск сборника рецептов. В нем мы разберем пример парсинга Авито, научимся расшифровывать телефонные номера, скрытые за JS и будем анализировать тексты.

    Парсинг Авито
    Если просмотреть сайты с вакансиями для фрилансеров, то можно увидеть, что очень часто требуется парсить популярный сайт объявлений avito.ru. Чаще всего в результате нужна база телефонов, реже - списки объявлений и цены. Данная информация может быть необходима маркетологам, для изучения ситуации на рынке, спамерам для рассылки смс и т.д...
    Задачу по парсингу Авито можно решить также с помощью А-Парсера. О том как это сделать - читайте по ссылке выше.
    [​IMG]

    Выборочная обработка JavaScript: расшифровка телефонов
    Бывает, что при парсинге различных ресурсов можно наткнуться на информацию, которая скрыта скриптом на JavaScript. До недавнего времени A-Parser не умел обрабатывать JS, и такие сайты оставались в "зоне недоступности". Но начиная с версии 1.1.318 A-Parser научился выборочно работать с JS. Поэтому теперь есть возможность более эффективно парсить такие ресурсы и получать нужную информацию.
    Как это делать и больше подробностей о поддержке JS в А-Парсере читайте по ссылке выше.
    [​IMG]

    Анализ текста

    Иногда возникает необходимость проанализировать спаршенный или написанный текст по различным параметрам (например: тошнота, водность, определить тематику и язык, найти наиболее повторяющиеся слова и т.п.). Для этого существует много различных приложений и онлайн-сервисов. Парсинг одного из таких сервисов будет показан по ссылке выше.
    [​IMG]

    Почти 3 месяца назад у нас появилась Платная услуга по составлению заданий для А-Парсера. Она оказалась очень актуальна среди новых пользователей парсера, а также среди тех, у кого не хватает времени на его изучение. За время ее существования было составлено более 70 заданий, при этом 75% состояли из 2-х и более пресетов. Среднее время на составление одного заказа, от согласования деталей до получения готового набора пресетов, составляет около 4 часов. При этом, каждый пресет тщательно тестируется, а получаемый результат обсуждается с клиентом.

    Так как A-Parser - это программа для парсинга различной информации, 26 ноября, во Всемирный день информации, будет разыграно:
    • 5 пакетов прокси (100 потоков на месяц)
    • 3 бесплатных составления 1-го задания для А-Парсера
    В акции принимают участие все, кто ретвитнет нашу новость об этой акции в Twitter. Подписывайтесь на наши каналы в Twitter: русскоязычный @a_parser и англоязычный @a_parser_en и следите за новостями на сайте! Победители акции будут определены случайно с помощью сервиса random.org. Видео определения победителей будет выложено вместе с результатами акции.

    Еще больше различных рецептов в нашем Каталоге примеров!

     
    #1 Forbidden, 2 ноя 2015
    Последнее редактирование: 2 ноя 2015
    uomi и Sobesednic нравится это.
  2. iharrby

    iharrby A-Parser Pro License
    A-Parser Pro

    Регистрация:
    30 май 2015
    Сообщения:
    6
    Симпатии:
    3
    по акции вопрос - одним акаунтом можно ретвитнуть? ) у меня пару для разных направлений работы )
     
  3. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    1.921
    Симпатии:
    1.352
    Можно ретвитить с любых своих аккаунтов. Боты запрещены.
     
  4. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    1.921
    Симпатии:
    1.352

Поделиться этой страницей