SE::Yandex::Translate - Dịch văn bản thông qua công cụ dịch của Yandex

Tổng quan về công cụ cào dữ liệu

Trình dịch văn bản đa luồng nhanh chóng, lên đến 2100 yêu cầu mỗi phút, thông qua dịch vụ Yandex. Công cụ cào dữ liệu này cho phép dịch bất kỳ khối lượng văn bản nào ở chế độ tự động, giúp bạn có được nội dung độc nhất để lấp đầy trang web, đăng lên mạng xã hội hoặc cho bất kỳ tài nguyên nào khác. Công cụ cào dữ liệu tự động xác định ngôn ngữ nguồn của nội dung, bạn chỉ cần chỉ định ngôn ngữ kết quả. Yandex translator có khả năng xử lý khối lượng văn bản khổng lồ mà không tiêu tốn nhiều tài nguyên.
Dữ liệu thu thập được
- Văn bản đã dịch
- Ngôn ngữ của văn bản gốc
Tính năng
- Lựa chọn ngôn ngữ dịch
- Tự động xác định ngôn ngữ
Ứng dụng
- Dịch thuật văn bản
- Lấy các nội dung khác nhau bằng ngôn ngữ cần thiết để sử dụng tiếp
Truy vấn
Trong các truy vấn, bạn cần chỉ định bất kỳ văn bản nào cần dịch, ví dụ:
A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!
Các ví dụ về định dạng kết quả
A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả ở dạng tùy ý cũng như dạng cấu trúc như CSV hoặc JSON
Xuất mặc định
Định dạng kết quả:
$query - $translated\n
Ví dụ kết quả:
A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total! - A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!
Chỉ xuất văn bản đã dịch
Định dạng kết quả:
$translated\n
Ví dụ kết quả:
A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!
Xuất ra bảng CSV
Định dạng kết quả:
[% tools.CSVline(query, detected, translated) %]
Ví dụ kết quả:
"A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!",en,"A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!"
Lưu ở định dạng SQL
Định dạng kết quả:
[% "INSERT INTO text VALUES('" _ query _ "', '"; detected _ "', '"; translated _ "')\n"; %]
Ví dụ kết quả:
INSERT INTO text VALUES('A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!', 'en', 'A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!')
Dump kết quả sang JSON
Định dạng kết quả chung:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.query = query;
obj.detected = p1.detected;
obj.translated = p1.translated;
obj.json %]
Văn bản bắt đầu:
[
Văn bản kết thúc:
]
Ví dụ kết quả:
[{"query":"A-Parser - a multi-threaded parser of search engines, site assessment services, keywords, content(text, links, random data) and much more(youtube, pictures, translators...). A-Parser combines over 60 parsers in total!","translated":"A-Parser - trình cào dữ liệu đa luồng cho các công cụ tìm kiếm, dịch vụ đánh giá trang web, từ khóa, nội dung (văn bản, liên kết, dữ liệu ngẫu nhiên) và nhiều thứ khác (youtube, hình ảnh, trình dịch...). A-Parser kết hợp tổng cộng hơn 60 công cụ cào dữ liệu!","detected":"en"}]
Để các tùy chọn "Prepend text" và "Append text" có sẵn trong Trình chỉnh sửa tác vụ, bạn cần kích hoạt "More options".
Các cài đặt có thể
| Tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| AntiGate preset | default | Chọn preset Util::AntiGate, chi tiết về cài đặt tại đây |
| AntiGate preset for old captcha | default | Tương tự như AntiGate preset, nhưng chỉ được sử dụng cho các captcha thông thường (cũ, dưới dạng một hình ảnh). Nếu không chọn preset ở đây, preset được chọn trong AntiGate preset sẽ được sử dụng cho các captcha đó. |
| Experimental img captcha max count | 5 | Số lượng tối đa các hình ảnh captcha lặp lại cho mỗi lần thử |
| Preffered captcha type | Click | Chọn loại captcha ưu tiên: Click hoặc Puzzle |
| From language | Auto-Detect | Chọn ngôn ngữ để dịch văn bản từ đó, mặc định là tự động xác định |
| To language | English | Chọn ngôn ngữ cần thực hiện dịch sang |
| Use sessions | ☑ | Khả năng tắt việc sử dụng phiên (sessions) |
