跳转到主要内容

SE::Yandex::Translate - 通过 Yandex 翻译器翻译文本

Yandex Translate

爬虫工具概览

爬虫工具概览

这是一款通过 Yandex 服务进行文本翻译的快速、多线程翻译工具,每分钟最高可处理 2100 个请求。该爬虫工具允许以自动模式翻译任意数量的文本,为您提供用于填充网站、发布社交网络或其他任何资源的独特内容。该爬虫工具会自动识别内容的源语言,您只需指定结果语言。Yandex 翻译能够处理海量文本,同时消耗极少的资源。

采集数据

  • 翻译后的文本
  • 源文本语言

功能

  • 选择翻译语言
  • 自动语言检测

应用场景

  • 文本翻译
  • 获取所需语言的各种内容以供后续使用

查询

在查询中需要指定任何待翻译的文本,例如:

A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!

结果输出示例

A-Parser 凭借内置的 Template Toolkit 模板引擎支持灵活的结果格式化,这使其能够以任意形式输出结果,包括 CSV 或 JSON 等结构化格式。

默认输出

结果格式:

$query - $translated\n

结果示例:

A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total! - A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!

仅输出翻译后的文本

结果格式:

$translated\n

结果示例:

A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!

输出到 CSV 表格

结果格式:

[% tools.CSVline(query, detected, translated) %]

结果示例:

"A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!",en,"A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!"

以 SQL 格式保存

结果格式:

[%  "INSERT INTO text VALUES('" _ query _ "', '";   detected _ "', '";  translated _ "')\n";  %]

结果示例:

INSERT INTO text VALUES('A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!', 'en', 'A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!')

将结果转储为 JSON

通用结果格式:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.query = query;
obj.detected = p1.detected;
obj.translated = p1.translated;

obj.json %]

起始文本:

[

结束文本:

]

结果示例:

[{"query":"A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!","translated":"A-Parser - 多线程搜索引擎、网站评估服务、关键词、内容(文本、链接、随机数据)及更多内容(YouTube、图片、翻译器...)的爬虫工具。A-Parser 总共集成了 60 多个爬虫工具!","detected":"en"}]
提示

要在任务编辑器中使用“Prepend text”和“Append text”选项,需要激活“More options”。

可选设置

参数默认值描述
AntiGate presetdefault选择预设 Util::AntiGateUtil::AntiGate,更多设置详情请见此处
AntiGate preset for old captchadefault类似于 AntiGate preset,但仅用于普通(旧式,单张图片形式)验证码。如果此处未选择预设,则此类验证码将使用在 AntiGate preset 中选择的预设。
Experimental img captcha max count5每次尝试的最大重复验证码图片数量
Preffered captcha typeClick选择首选验证码类型:点击 (Click) 或拼图 (Puzzle)
From languageAuto-Detect选择从哪种语言翻译文本,默认设为自动检测
To languageEnglish选择需要翻译成的目标语言
Use sessions禁用会话使用的选项