SE::Yandex::Translate - 通过 Yandex 翻译器翻译文本

爬虫工具概览

这是一款通过 Yandex 服务进行文本翻译的快速、多线程翻译工具,每分钟最高可处理 2100 个请求。该爬虫工具允许以自动模式翻译任意数量的文本,为您提供用于填充网站、发布社交网络或其他任何资源的独特内容。该爬虫工具会自动识别内容的源语言,您只需指定结果语言。Yandex 翻译能够处理海量文本,同时消耗极少的资源。
采集数据
- 翻译后的文本
- 源文本语言
功能
- 选择翻译语言
- 自动语言检测
应用场景
- 文本翻译
- 获取所需语言的各种内容以供后续使用
查询
在查询中需要指定任何待翻译的文本,例如:
A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!
结果输出示例
A-Parser 凭借内置的 Template Toolkit 模板引擎支持灵活的结果格式化,这使其能够以任意形式输出结果,包括 CSV 或 JSON 等结构化格式。
默认输出
结果格式:
$query - $translated\n
结果示例:
A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total! - A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!
仅输出翻译后的文本
结果格式:
$translated\n
结果示例:
A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!
输出到 CSV 表格
结果格式:
[% tools.CSVline(query, detected, translated) %]
结果示例:
"A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!",en,"A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!"
以 SQL 格式保存
结果格式:
[% "INSERT INTO text VALUES('" _ query _ "', '"; detected _ "', '"; translated _ "')\n"; %]
结果示例:
INSERT INTO text VALUES('A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!', 'en', 'A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!')
将结果转储为 JSON
通用结果格式:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.query = query;
obj.detected = p1.detected;
obj.translated = p1.translated;
obj.json %]
起始文本:
[
结束文本:
]
结果示例:
[{"query":"A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!","translated":"A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!","detected":"en"}]
提示
要在任务编辑器中使用“Prepend text”和“Append text”选项,需要激活“More options”。
可选设置
| 参数 | 默认值 | 描述 |
|---|---|---|
| AntiGate preset | default | 选择预设 Util::AntiGate,更多设置详情请见此处 |
| AntiGate preset for old captcha | default | 类似于 AntiGate preset,但仅用于普通(旧式,单张图片形式)验证码。如果此处未选择预设,则此类验证码将使用在 AntiGate preset 中选择的预设。 |
| Experimental img captcha max count | 5 | 每次尝试的最大重复验证码图片数量 |
| Preffered captcha type | Click | 选择首选验证码类型:点击 (Click) 或拼图 (Puzzle) |
| From language | Auto-Detect | 选择从哪种语言翻译文本,默认设为自动检测 |
| To language | English | 选择需要翻译成的目标语言 |
| Use sessions | ☑ | 禁用会话使用的选项 |
