В Апарсере есть замечательный HTTP парсер, который может почти все что нужно, но не может разгадывать капчи.
Было бы здорово иметь возможность создавать профили настроек разгадывания капчи, которые бы позволяли указать парсеру, что:
1) данный ответ сайта/сервиса содержит капчу
2) урл картинки с капчей можно достать вот такой-то регуляркой (правда не знаю, что делать с flash капчами)
3) дополнительные поля (типа captcha_id) можно достать таким-то регулярками
4) после разгадывания капчи, нужно отправить запрос на такой то урл (шаблон урл с подстановкой всех параметров) методом GET или методом POST
Эти пункты я привел для примера, возможно они должны быть другими (Форбидену виднее).
Это позволит серьезно расширить функциональность Апарсера, а пользователи смогут самостоятельно создавать парсеры сервисов с капчей.
Было бы здорово иметь возможность создавать профили настроек разгадывания капчи, которые бы позволяли указать парсеру, что:
1) данный ответ сайта/сервиса содержит капчу
2) урл картинки с капчей можно достать вот такой-то регуляркой (правда не знаю, что делать с flash капчами)
3) дополнительные поля (типа captcha_id) можно достать таким-то регулярками
4) после разгадывания капчи, нужно отправить запрос на такой то урл (шаблон урл с подстановкой всех параметров) методом GET или методом POST
Эти пункты я привел для примера, возможно они должны быть другими (Форбидену виднее).
Это позволит серьезно расширить функциональность Апарсера, а пользователи смогут самостоятельно создавать парсеры сервисов с капчей.