1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Парсинг и чистка сниппетов

Тема в разделе "Техническая поддержка", создана пользователем Антон, 2 авг 2014.

  1. fsmakov

    fsmakov A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    10 янв 2014
    Сообщения:
    19
    Симпатии:
    5
    вот снова сделал
    задание:
    [​IMG]

    результат:
    [​IMG]

    что не так в задании?
    Кстати, парсит из быстрого задания уже с другим результатом. .хз, может обновили чего. .вчера я парсил на версии 1,1,41
     
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    На скрине видно ошибку в формате результата, поскольку там пропущена кавычка он выводит ВСЕ элементы массивы а не только сниппет
    правильный формат:
    Код:
    $p1.serp.format('$snippet\n')
    [​IMG]
     
  3. fsmakov

    fsmakov A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    10 янв 2014
    Сообщения:
    19
    Симпатии:
    5
    От точно. .спасибо!
     
  4. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    Forbidden, такая вот проблема - раньше для чистки снипетов убирал цифры - регексом \d+ ( http://a-parser.com/threads/669/#post-1793 )
    сейчас почему то это не работает, как вообще можно почистить результат от цифр, латиницы и всех знаков припенания -
    то есть оставить только кирилицу и точки с запятой?
     
  5. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    все должно работать :) покрайней мере на Stable версии
     
  6. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.795
    Оставить только кириллицу можно примерно так
    [​IMG]
     
    Force68 и Sobesednic нравится это.
  7. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    Forbidden, спасибо - то что надо.
     
  8. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    после этого у меня получилось так http://prntscr.com/7rsoan
    подскажите как удалить то что на скрине выделено красным?
     
  9. LmPopo

    LmPopo A-Parser Pro License
    A-Parser Pro

    Регистрация:
    22 янв 2013
    Сообщения:
    88
    Симпатии:
    26
    1) ^[а-я]{3}\s+\.{3}\s*
    2) \.{3,}
     
    fri-lancer нравится это.
  10. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Вторая регулярка работает, а первая почему то нет...
     
  11. LmPopo

    LmPopo A-Parser Pro License
    A-Parser Pro

    Регистрация:
    22 янв 2013
    Сообщения:
    88
    Симпатии:
    26
  12. LmPopo

    LmPopo A-Parser Pro License
    A-Parser Pro

    Регистрация:
    22 янв 2013
    Сообщения:
    88
    Симпатии:
    26
    Может приоритет отдал второй? она могла точки вырезать, поэтому первая и не срабатывает
     
  13. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Понял в чем проблема, перед месяцем у меня в файле пробел.
    т.е. так http://prntscr.com/7ruil3 , не пойму как регулярку составить.
     
  14. LmPopo

    LmPopo A-Parser Pro License
    A-Parser Pro

    Регистрация:
    22 янв 2013
    Сообщения:
    88
    Симпатии:
    26
    ^\s*[а-я]{3}\s+\.{3}\s*
     
    fri-lancer нравится это.
  15. fri-lancer

    fri-lancer A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2014
    Сообщения:
    90
    Симпатии:
    7
    Теперь гуд! Спасибо!
     
    LmPopo нравится это.
  16. ks8

    ks8 New Member

    Регистрация:
    13 ноя 2015
    Сообщения:
    1
    Симпатии:
    0
    Здравствуйте. Подскажите как спарсить, например, только первые 3 сниппета. Спасибо.
     
  17. Support

    Support Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    16 мар 2012
    Сообщения:
    4.547
    Симпатии:
    2.164
    Добрый день.
    Как вариант вывести в результат только 3 первых:
    Код:
    $serp.0.snippet
    $serp.1.snippet
    $serp.2.snippet
     
    ks8 нравится это.
  18. evgeshik

    evgeshik A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 сен 2016
    Сообщения:
    20
    Симпатии:
    3
    Здравствуйте. Хочу спарсить сниппеты гугловские. Каждый снипет с новой строки. Вроде все делаю как на скринах выше, но что-то файл пустой получается.
    http://prntscr.com/fuhkso
    в чем бок у меня?
     
  19. Support Юра

    Support Юра A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    13 июн 2017
    Сообщения:
    122
    Симпатии:
    71
    Добрый день. Для того чтобы установить причину по которой у Вас получается пустой результат, необходимо проанализировать лог выполнения задания. Но судя из Вашего скрина, причина может быть в необходимости добавления антигейта для обхода капчи, которую выдает поисковая система Google. Как настроить антигейт, детально описано здесь https://a-parser.com/wiki/setting-antigate/. Если результат будет негативным, просьба предоставить скрин с логом выполнения задания и скрин работающего задания из очереди.
     
    evgeshik нравится это.

Поделиться этой страницей