Улучшение Распределение нагрузки между ядрами процессора

yadzha · 6 авг 2013

Сабж. Не удобно запускать и управлять (и обновлять) 5-7 копями парсера с целью распределения нагрузки на сервер

Forbidden · 6 авг 2013

В какой задаче апарсер упирается в процессор?

yadzha · 6 авг 2013

Постоянно упираюсь в процессор. Например, сегодня одновременно парсил майлы с вконтакте (50 потоков без прокси), сниппеты с Гугла (прокси 75 потоков) и ссылки на авито из Гугла (прокси 75 потоков). Задействовано было только 1 ядро из 8 и ядро загружено на 100%. Загрузка остальных ядер 0%. Из за перегрузки ядра, общая скорость парсинга меньше. При отключии парсинга сниппетов, загрузка ядра падает и скорость загрузки VK и Avito увеличивается почти в 2 раза.

Загрузку процессора проверял утилитой htop. жесткий диск (iotop) не загружен, памяти свободной тоже достаточно

yadzha · 6 авг 2013

Похоже причина загрузки процессора в том, что базы получаются большие, по несколько десятков и сотен мегов (от 1млн строк в каждом файле) и на удаление дублей тратится много процессорного времени

Forbidden · 6 авг 2013

да врятли, это очень быстрые операции, я думаю основная причина в неоптимизированных регулярных выражениях которые ты указываешь

попробуй нагрузить ядро каким нибудь парсингом без своих регулярок

yadzha · 6 авг 2013

Регулярки не причем. Загрузил сейчас задание - парсить все подряд сниппеты в зоне ru. Результат как всегда - ядро перегружено, скорость парсинга из за этого относительно небольшая. Задача ресурсоемкая, за 10мин напарсил ~500 мегов сниппетов.
Проц - Intel Quad-Core Xeon E3-1230, 3.4 Ghz

Forbidden · 6 авг 2013

а покажи вывод обычного top

и какой процессор?

yadzha · 6 авг 2013

Проц - Intel Quad-Core Xeon E3-1230, 3.4 Ghz. До этого был Core i7-920 2.6Ghz, там тоже ядро перегружалось

Forbidden · 6 авг 2013

а зачем в задании пустой Parse custom result? можешь без него замерить?
и какой стоит Unique level?

yadzha · 6 авг 2013

Да точно, убрал Parse custom result, теперь 1 задание парсинга сниппетов на 300 потоках - загрузка ядра ~90%, в 3 раза увеличилась скорость. Unique level = Dynamic (без hash)

Но это частный случай, я в основном использую Parse custom result c регулярками, по 5-10 одновременных заданий стоит в работе. В любом случае приходится распределять задания между несколькими копиями парсера.

Регулярки использую такие:
(([A-Za-z0-9_\.\-]{1,20})@([A-Za-z0-9\.\-]{1,20})\.([A-Za-z]{2,4}))
Или конструкции в таком стиле - Контактное лицо:</div>(.*?)<

Forbidden · 6 авг 2013

Эта регулярка очень тяжелая т.к. не имеет опорных символов

Улучшение Распределение нагрузки между ядрами процессора

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

yadzha A-Parser Pro License
A-Parser Pro

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

Поделиться этой страницей

О нас

Быстрая навигация

Twitter

Поддержка

Быстрый поиск

Улучшение Распределение нагрузки между ядрами процессора

yadzha A-Parser Pro License A-Parser Pro

Forbidden Administrator Команда форума A-Parser Enterprise

yadzha A-Parser Pro License A-Parser Pro

yadzha A-Parser Pro License A-Parser Pro

Forbidden Administrator Команда форума A-Parser Enterprise

yadzha A-Parser Pro License A-Parser Pro

Forbidden Administrator Команда форума A-Parser Enterprise

yadzha A-Parser Pro License A-Parser Pro

Forbidden Administrator Команда форума A-Parser Enterprise

yadzha A-Parser Pro License A-Parser Pro

Forbidden Administrator Команда форума A-Parser Enterprise

Поделиться этой страницей

Служба поддержки

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

yadzha A-Parser Pro License
A-Parser Pro

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

yadzha A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise