Chuyển đến nội dung chính

SE::Yandex::Translate - Dịch văn bản thông qua công cụ dịch của Yandex

Yandex Translate

Tổng quan về công cụ cào dữ liệu

Tổng quan về công cụ cào dữ liệu

Trình dịch văn bản đa luồng nhanh chóng, lên đến 2100 yêu cầu mỗi phút, thông qua dịch vụ Yandex. Công cụ cào dữ liệu này cho phép dịch bất kỳ khối lượng văn bản nào ở chế độ tự động, giúp bạn có được nội dung độc nhất để lấp đầy trang web, đăng lên mạng xã hội hoặc cho bất kỳ tài nguyên nào khác. Công cụ cào dữ liệu tự động xác định ngôn ngữ nguồn của nội dung, bạn chỉ cần chỉ định ngôn ngữ kết quả. Yandex translator có khả năng xử lý khối lượng văn bản khổng lồ mà không tiêu tốn nhiều tài nguyên.

Dữ liệu thu thập được

  • Văn bản đã dịch
  • Ngôn ngữ của văn bản gốc

Tính năng

  • Lựa chọn ngôn ngữ dịch
  • Tự động xác định ngôn ngữ

Ứng dụng

  • Dịch thuật văn bản
  • Lấy các nội dung khác nhau bằng ngôn ngữ cần thiết để sử dụng tiếp

Truy vấn

Trong các truy vấn, bạn cần chỉ định bất kỳ văn bản nào cần dịch, ví dụ:

A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!

Các ví dụ về định dạng kết quả

A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả ở dạng tùy ý cũng như dạng cấu trúc như CSV hoặc JSON

Xuất mặc định

Định dạng kết quả:

$query - $translated\n

Ví dụ kết quả:

A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total! - A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!

Chỉ xuất văn bản đã dịch

Định dạng kết quả:

$translated\n

Ví dụ kết quả:

A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!

Xuất ra bảng CSV

Định dạng kết quả:

[% tools.CSVline(query, detected, translated) %]

Ví dụ kết quả:

"A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!",en,"A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!"

Lưu ở định dạng SQL

Định dạng kết quả:

[%  "INSERT INTO text VALUES('" _ query _ "', '";   detected _ "', '";  translated _ "')\n";  %]

Ví dụ kết quả:

INSERT INTO text VALUES('A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!', 'en', 'A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!')

Dump kết quả sang JSON

Định dạng kết quả chung:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.query = query;
obj.detected = p1.detected;
obj.translated = p1.translated;

obj.json %]

Văn bản bắt đầu:

[

Văn bản kết thúc:

]

Ví dụ kết quả:

[{"query":"A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!","translated":"A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!","detected":"en"}]
mẹo

Để các tùy chọn "Prepend text" và "Append text" có sẵn trong Trình chỉnh sửa tác vụ, bạn cần kích hoạt "More options".

Các cài đặt có thể

Tham sốGiá trị mặc địnhMô tả
AntiGate presetdefaultChọn preset Util::AntiGateUtil::AntiGate, chi tiết về cài đặt tại đây
AntiGate preset for old captchadefaultTương tự như AntiGate preset, nhưng chỉ được sử dụng cho các captcha thông thường (cũ, dưới dạng một hình ảnh). Nếu không chọn preset ở đây, preset được chọn trong AntiGate preset sẽ được sử dụng cho các captcha đó.
Experimental img captcha max count5Số lượng tối đa các hình ảnh captcha lặp lại cho mỗi lần thử
Preffered captcha typeClickChọn loại captcha ưu tiên: Click hoặc Puzzle
From languageAuto-DetectChọn ngôn ngữ để dịch văn bản từ đó, mặc định là tự động xác định
To languageEnglishChọn ngôn ngữ cần thực hiện dịch sang
Use sessionsKhả năng tắt việc sử dụng phiên (sessions)