Идея - сделать листы проксей пригодные например отдельно для google, отдельно для yandex.
Смысл в том, чтобы для каждого парсера, можно было бы подобрать наиболее подходящие прокси, тем самым теоретически увеличив скорость парсинга.
1. В "настройках проверки проксей" в настройку добавляем расширенный вердикт, подобное понятие есть у софта для поиска проксей, пример:
[JUDGE]
HOST=http://www.google.com/search?btnG=1&filter=0&start=0&q=inurl:"wp-content"
VERDICT=schema.org
[SETTINGS]
THREADS=100
TIMEOUT=30
т.е. для настройки my_proxy_list_google добавляем HOST = "http://www.google.com/" VERDICT="schema.org"
для my_proxy_list_yandex добавляем HOST = "http://www.yandex.ru/" VERDICT="https://yandex.ru/clck"
2. В "Проверка проксей" делаем возможность параллельно запускать несколько проверок проксей для разных настроек my_proxy_list_google, my_proxy_list_yandex, <все активные прокси из всех листов>
3. В Настройках парсеров добавляем параметр для выбора "Список проксей": <все активные прокси из всех листов>, my_proxy_list_google, my_proxy_list_yandex
profit!
Смысл в том, чтобы для каждого парсера, можно было бы подобрать наиболее подходящие прокси, тем самым теоретически увеличив скорость парсинга.
1. В "настройках проверки проксей" в настройку добавляем расширенный вердикт, подобное понятие есть у софта для поиска проксей, пример:
[JUDGE]
HOST=http://www.google.com/search?btnG=1&filter=0&start=0&q=inurl:"wp-content"
VERDICT=schema.org
[SETTINGS]
THREADS=100
TIMEOUT=30
т.е. для настройки my_proxy_list_google добавляем HOST = "http://www.google.com/" VERDICT="schema.org"
для my_proxy_list_yandex добавляем HOST = "http://www.yandex.ru/" VERDICT="https://yandex.ru/clck"
2. В "Проверка проксей" делаем возможность параллельно запускать несколько проверок проксей для разных настроек my_proxy_list_google, my_proxy_list_yandex, <все активные прокси из всех листов>
3. В Настройках парсеров добавляем параметр для выбора "Список проксей": <все активные прокси из всех листов>, my_proxy_list_google, my_proxy_list_yandex
profit!