Подскажите, правильно я понимаю, что парсить а-парсером не получается, так как требует ашрефс авторизацию? А не из-за того, что там поменяли верстку? Хотя опять же смотрю вручную на странице https://ahrefs.com/backlink-checker , если бы нужна была авторизация, то и тут кидало бы сразу на авторизацию, но данные доступны также без авторизации как и раньше.
Сейчас парсер работает, но вроде есть проблема еще с проксями. Подскажите, почему могут использоваться другие прокси в данном парсере от тех, что указаны в конфиге потоков?
Ну пример, наверное, не могу показать, потому что не совсем понимаю, как его можно продемонстрировать. Вот так у меня выглядит пресет и тестовый парсинг https://prnt.sc/tvmcit, как видно, там идут прокси http://45.227.255.159:5753 это паблик прокси, но в конфиге потоков у меня стоят совсем другие прокси, они все на порту 4045. Версия парсера бета: 1.2.956
Как вариант - в Тестовом парсинге, где видно какой проксичекер выбран и какие прокси используются. Либо напишите в любой чат поддержки (контакты: https://a-parser.com/pages/support/) и предоставьте доступ к парсеру, чтобы мы сами смогли увидеть проблему.
Сейчас также посмотрел, показывается проблема не касается этого парсера, а на всех парсерах происходит такое. Например, паршу вордстат сейчас также, показывает, что всего проксей 4к, но проксей на самом деле всего 800, которые указаны в конфиге потоков. Т.е. парсер не учитывает почему-то данные из конфига потоков, а берет всегда все валидные прокси их всех прокси чекеров.
Ок, обязательно сделаю, но скорее всего только в понедельник, так как сейчас бежать уже надо, уезжаю на отдых на выходные.
Написал в чат по данной проблеме, сотрудник ТП обещал разобраться с данной проблемой. Ну насколько я сам вижу, тут реально баг, потому что теперь нельзя даже поменять прокси при остановке задания, прокси из конфига потоков а-парсер не учитывает как приоритетные почему-то, а парсер берет прокси всегда теперь из настроек парсеров или из переопределяемых опций, но никак не из конфига пототоков. У саппорта также, как я понял, повторилась данная ошибка.
Очень вероятно, что это действительно баг. В данный момент мы выясняем это. Значение "all" в настройках парсера должно задействовать лишь те проксичекеры, которые указаны в конфиге потоков, а сейчас происходит так, что "all" использует ВСЕ доступные проксичекеры независимо от указанных в конфиге. Как только будет более точная информация касательно данной проблемы, отпишусь здесь, как и обещал.
Добавлю тут еще раз пример, не связанный со значением "all". Работаем с парсером Яндекса, в настройках парсера указано прокси1, в настройках потоков указано прокси2, парсер на данный момент будет использовать в работе прокси1, несмотря на то, что он должен использовать прокси2. Т.е. тут не только проблема со значением "all", а дело в том, что а-парсер почему-то перестал в последних обновах считать прокси в конфиге потоков приоритетными.