1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

А-Парсер и Пандора!

Тема в разделе "Трёп", создана пользователем Topper, 23 апр 2015.

Статус темы:
Закрыта.
  1. btr

    btr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    198
    Симпатии:
    116
    ))
    Да даже к примеру если я хочу парсить картинки сразу с двух мест, и разбавлять их уже в шаблоне, так же видосы, парсить к примеру пару тубов, и в доре ставить рандомно или с одного или с другого.
     
  2. btr

    btr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    198
    Симпатии:
    116
    предыдущее предложение так и зависло , а жаль =(
    @Topper вопрос по поводу сниппетов, допустим я паршу один и тот же поисковик для сниппетов и текста, и получается парсим поисковик второй раз в холостую, тк при парсинге линков можно забирать сразу же и сниппеты. Может есть смысл сделать какую то галочку, при включении которой сниппеты будут браться с парсера текста? экономим время и ресурсы апарсера.

    PS прогрессбар показывает процесс парсинга и обработки маленькой пачки, а общего прогресса не видно, если можно добавь пожалуйста общий прогресс для парсинга 1-го дора.
     
    #322 btr, 5 июл 2016
    Последнее редактирование: 5 июл 2016
  3. kashim

    kashim A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    23 апр 2015
    Сообщения:
    36
    Симпатии:
    12
    Поддержу идею. Мне хотелось бы такой функционал:

    1. Перевод ключа ru на eng из бинг транслейтор
    2. Парсинг по eng ключу видео с порнотуба, например какого-нибудь порнхаба.
    3. Сохранение видео в файл с ru ключом.

    Мы с btr хотели стандартный ютобовский шаб перепилить под это дело. Но, саппорт говорит, что eng кей не получится передать на второй парсер в рамках одного шаблона. По этому хотелось бы такой функционал возложить на пандору.
     
    List и Legolaze нравится это.
  4. List

    List A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    1 май 2015
    Сообщения:
    11
    Симпатии:
    6
    Антон сказал(а):
    Предлагаю добавить в окно lap обновляемую сводку о том, для скольки ключей спарсился текст, сниппеты и т.д. и для скольки ещё осталось.

    Topper, на какой стадии разработка данной опции? :)
     
    Anatoliy нравится это.
  5. Legolaze

    Legolaze A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    6 апр 2016
    Сообщения:
    4
    Симпатии:
    1
    Topper чет тут давно нечего не писал:) Может забыл про нас
     
    Anatoliy нравится это.
  6. Anatoliy

    Anatoliy A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    22 май 2016
    Сообщения:
    48
    Симпатии:
    10
    Да думаю человек имеет право на отпуск, ну а потом Topper очень отзывчив, пишите тут что хотите видеть в дальнейшем и я уверен что он допилит...
     
    Legolaze нравится это.
  7. creck

    creck A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    18 апр 2014
    Сообщения:
    46
    Симпатии:
    7
    Ребята, подскажите как увеличить скорость парсинга. У меня за двое суток напарсило контента на 140 тыщ ключей. Есть возможность, так сказать увеличить скорость перебора ключей? То есть что бы за сутки парсило контент, и обрабатывало не 70 тыщ ключей а больше. Возможно что то в настройках, или как у кого?
     
    #327 creck, 16 сен 2016
    Последнее редактирование: 16 сен 2016
  8. Anatoliy

    Anatoliy A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    22 май 2016
    Сообщения:
    48
    Симпатии:
    10
    Тут уже зависит от вашей железки и от количества проксей и потоков.
     
  9. btr

    btr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    198
    Симпатии:
    116
    нужно еще смотреть в чем именно загвоздка, у меня парсинг пролетает очень быстро, а вот чистка и сохранение текста очень долго. =(
     
  10. creck

    creck A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    18 апр 2014
    Сообщения:
    46
    Симпатии:
    7
    Проблема, очень медленно парсит тексты с сайтов

    [​IMG]

    Часа 3-4 лузает это количество. Сервак ,8 ядер, 16 озу канал 300 мбит довнлоад и 400 уплоад. Прокси свои тунели 6000. Да, и сайты парсю без прокси. В чем может быть причина?

    [​IMG]
     
  11. kashim

    kashim A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    23 апр 2015
    Сообщения:
    36
    Симпатии:
    12
    Наверняка комп подключен к роутеру, он и тормозит.
     
  12. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    creck, а сколько у вас текстовки на кей парсится?
     
  13. creck

    creck A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    18 апр 2014
    Сообщения:
    46
    Симпатии:
    7
    От 5000 символов до 12000 символов. Ну эт ото что замечал.
     
  14. Force68

    Force68 A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 фев 2013
    Сообщения:
    175
    Симпатии:
    49
    я имел ввиду сколько страниц с выдачи на кей? я только первую страницу с выдачи беру, т.е. грубо говоря 10 ссылок на кей распаршивается,
    потому что мне надо всего 2-4к знаков на кей, а у вас там на скрине смотрю вроде и скорость отличная но 300к ссылок в задании, это на сколько кеев то?

    Т.е. с моими настройками это примерно на 30к кеев текстовки у вас парсится.
     
    #334 Force68, 16 сен 2016
    Последнее редактирование: 16 сен 2016
  15. creck

    creck A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    18 апр 2014
    Сообщения:
    46
    Симпатии:
    7
    Ставлю 10 000 в линкАпарсере.
    Настройки парсинга
    [​IMG]

    Очень много уходит в бад. Например с 320 тыщ ключей, в бад за парсинг уходит 120 тыщ. Приходится запускать заново по несколько раз. С Topperом в аьке переписывался, просил что бы добавил фичу, те ключи которые обработал, сохранял где то отдельно. Потому что, когда список кеев большое, на 500 косарей, после парсинга многие отвалились в бад. Повторно использовать список уже для генерирования с 500 тыщ, очень утомительно долгий процес. Проще сразу поставить список тот на который обработан и сохранен в кеше. Вроде сказал что допилит.
     
  16. creck

    creck A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    18 апр 2014
    Сообщения:
    46
    Симпатии:
    7
    Также не понятная причина такого вылета ключей в бад, после повторных парсингов по ним, все кушает как надо. прокси рабочие, капч не наблюдается.????
     
  17. btr

    btr A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    11 фев 2013
    Сообщения:
    198
    Симпатии:
    116
    настрой сбор текста без прокси, я понимаю для парсинга одного сайта нужны прокси, но когда ты парсишь тысячи сайтов, и на каждый сайт делаешь всего один запрос, прокси не нужны как по мне.
    ЗЫ я собираю так же текст без проксей, скорость сбора конечно плавает, но в среднем примерно в 2 раза быстрее.
    ЗЫЗЫ Для апарсера достаточно 2 ядер и 4 гигов ОЗУ, он больше не возьмет просто, общался намедни с автором, уперется может либо в процессор, либо в медленные днс сервера.
     
  18. List

    List A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    1 май 2015
    Сообщения:
    11
    Симпатии:
    6
    Помогите пожалуйста.
    подскажите как правильно использовать свой список стоп слов в файлике LinkAParser.extraregex.txt
    например есть слова и не надо чтобы по ним парсился контент.
    Если не сложно каожите пример.
    Код:
    .org
    .us
    Adult
    sex
    porn
     
  19. creck

    creck A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    18 апр 2014
    Сообщения:
    46
    Симпатии:
    7
    Так я парсю без проксей сайты. Все остальное с проксями
     
  20. creck

    creck A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    18 апр 2014
    Сообщения:
    46
    Симпатии:
    7
    Ребята, у меня постоянно зависает программа. Когда доходит до Текст успешно спаршен, чистим и сохраняем.. То есть нет никаких дальше движений. Что может быть?
     
Статус темы:
Закрыта.

Поделиться этой страницей