跳转到主要内容

Util::YandexRecognize - 验证码识别

爬虫工具概览

作为插件组件用于其他爬虫工具中,适用于需要识别简单图片验证码的场景。

该爬虫工具的特点是利用 Yandex 翻译的功能进行识别。虽然识别准确率不算高,但其优势在于免费且速度相对较快。

应用场景

  • 在需要识别验证码才能获取结果的爬虫工具中进行验证码识别(可选或强制)
  • 在自定义 JS 爬虫工具中进行验证码识别
  • 识别图片中的少量文本数据(例如电话号码)

查询

在查询中需要指定验证码的链接,例如:

http://a-parser.com/img/captcha.jpeg

结果输出选项

  • $answer - 验证码答案
  • $error - 如果发生错误,显示错误描述

输出识别的文本

结果格式:

$answer

结果示例:

ifignt eyelids

可用设置