Здравствуйте, хочу предложить по прокси чеккеру две весьма дельные и полезные идеи.
1) Добавить опцию в aparser "Собирать прокси с URL первого уровня".
Что это значит. Вот к примеру мы зашли на главную страницу _https://proxylistdaily4you.blogspot.com/
Видим здесь 2 ссылки которые ведут на внутренние страницы. При включенной этой опции чтобы aparser умел зайти на эти внутренние странички и собрать прокси.
2) Чтобы aparser понимал макросы даты если таковы будут присутствовать в файле "список сайтов для парсинга проксей" часть будет с макросами, а другая без.
Приведу пример с двумя ссылками:
В файле sites.txt это выглядит так:
Описание макросов:
Это позволит в разы собирать большее количество проксей и не надо каждый день в файле редактировать даты особенно если таких сайтов тысячи.
1) Добавить опцию в aparser "Собирать прокси с URL первого уровня".
Что это значит. Вот к примеру мы зашли на главную страницу _https://proxylistdaily4you.blogspot.com/
Видим здесь 2 ссылки которые ведут на внутренние страницы. При включенной этой опции чтобы aparser умел зайти на эти внутренние странички и собрать прокси.
2) Чтобы aparser понимал макросы даты если таковы будут присутствовать в файле "список сайтов для парсинга проксей" часть будет с макросами, а другая без.
Приведу пример с двумя ссылками:
В файле sites.txt это выглядит так:
Описание макросов:
[year] - подставит на свое место полный текущий год. Прим. 2018
[year-2] то же самое что макрос [year] только параметр с цифрой 2 говорит что надо вывести год в двухзначном формате т.е. если сейчас 2018, то макрос [year-2] соответственно выводит нам 18
[dateday] - Выводит текущую дату к примеру
[month] - выводит номер текущего месяца, пример если сейчас июль то будет 07
[month-1] - выводит текущий месяц без нуля в начале. Если это июль то будет 7
Это позволит в разы собирать большее количество проксей и не надо каждый день в файле редактировать даты особенно если таких сайтов тысячи.
Последнее редактирование: