Подгрузка файлов из директории для перевода в DeepL

Парсер Подгрузка файлов из директории для перевода в DeepL 2021-02-27

Доступно владельцам лицензии

Support Vlad

A-Parser Enterprise License
A-Parser Enterprise
Пользователь Support Vlad разместил новый ресурс:

Подгрузка файлов из директории для перевода в DeepL - Пример подгрузки файлов из директории для перевода в DeepL

Аналогичен пресету Использование файлов целиком в качестве запросов, только в качестве переводчика выступает DeepL::Translator DeepL::Translator и в качестве запросов следует указывать директории, откуда будут подгружаться файлы.

Узнать больше об этом ресурсе...
 
При переводе файлов из директории выдает ошибку
по логам кажется, что он не делит текст на блоки (как делить пресет для гугла, переводящий по списку файлов) 413 Request Entity Too Large

Код:
eyJwcmVzZXQiOiJFeGFtcGxlOjpGaWxlc0Zyb21EaXJBc1F1ZXJpZXMiLCJ2YWx1
ZSI6eyJwcmVzZXQiOiJFeGFtcGxlOjpGaWxlc0Zyb21EaXJBc1F1ZXJpZXMiLCJw
YXJzZXJzIjpbWyJKUzo6RXhhbXBsZTo6RmlsZXNGcm9tRGlyQXNRdWVyaWVzIiwi
ZGVmYXVsdCIseyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6IkRlZXBMX1RyYW5zbGF0
b3JfcHJlc2V0IiwidmFsdWUiOiJkZSBwcm94eSJ9LHsidHlwZSI6Im92ZXJyaWRl
IiwiaWQiOiJwcm94eUNoZWNrZXIiLCJ2YWx1ZSI6ImFwYXJzZXIifV1dLCJyZXN1
bHRzRm9ybWF0IjoiJHAxLnRyYW5zbGF0ZWQiLCJyZXN1bHRzU2F2ZVRvIjoiZmls
ZSIsInJlc3VsdHNGaWxlTmFtZSI6InRyYW5zbGF0ZWRfZGVlcGxfZGUvJHtwMS5m
aWxlbmFtZX0iLCJhZGRpdGlvbmFsRm9ybWF0cyI6W10sInJlc3VsdHNVbmlxdWUi
OiJubyIsInF1ZXJpZXNGcm9tIjoidGV4dCIsInF1ZXJ5Rm9ybWF0IjpbIiRxdWVy
eSJdLCJ1bmlxdWVRdWVyaWVzIjpmYWxzZSwic2F2ZUZhaWxlZFF1ZXJpZXMiOmZh
bHNlLCJpdGVyYXRvck9wdGlvbnMiOnsib25BbGxMZXZlbHMiOmZhbHNlLCJxdWVy
eUJ1aWxkZXJzQWZ0ZXJJdGVyYXRvciI6ZmFsc2UsInF1ZXJ5QnVpbGRlcnNPbkFs
bExldmVscyI6ZmFsc2V9LCJyZXN1bHRzT3B0aW9ucyI6eyJvdmVyd3JpdGUiOnRy
dWUsIndyaXRlQk9NIjpmYWxzZX0sImRvTG9nIjoibm8iLCJsaW1pdExvZ3NDb3Vu
dCI6IjAiLCJrZWVwVW5pcXVlIjoiTm8iLCJtb3JlT3B0aW9ucyI6ZmFsc2UsInJl
c3VsdHNQcmVwZW5kIjoiIiwicmVzdWx0c0FwcGVuZCI6IiIsInF1ZXJ5QnVpbGRl
cnMiOltdLCJyZXN1bHRzQnVpbGRlcnMiOltdLCJjb25maWdPdmVycmlkZXMiOltd
LCJydW5UYXNrT25Db21wbGV0ZSI6bnVsbCwidXNlUmVzdWx0c0ZpbGVBc1F1ZXJp
ZXNGaWxlIjpmYWxzZSwicnVuVGFza09uQ29tcGxldGVDb25maWciOiJkZWZhdWx0
IiwidG9vbHNKUyI6IiIsInByaW8iOjUsInJlbW92ZU9uQ29tcGxldGUiOmZhbHNl
LCJjYWxsVVJMT25Db21wbGV0ZSI6IiIsInF1ZXJpZXMiOiJxdWVyaWVzXFxiazIi
LCJjYXRlZ29yeSI6W3sidGV4dCI6IlRyYW5zbGF0ZSIsImV4cGFuZGVkIjoxfV19
fQ==
 
Похоже что Deepl, кроме ограничения по кол-ву символов, также ограничивает кол-во предложений в тексте. И, в отличие от кол-ва символов, обойти ограничение по кол-ву предложений не получится из-за особенностей работы Deepl.
Т.к. в ваших файлах содержится не сплошной текст, а просто набор предложений по одному в строке, то более правильно будет подавать эти файлы в качестве запросов в стандартный DeepL::Translator DeepL::Translator без использования надстройки для чтения файлов целиком.
 
Может можно как то подпилить этот парсер или стандартный парсер deepl так, чтобы он мог переводить XML файлы? Я имею ввиду, чтобы теги которые в XML парсер не трогал (не переводил). Сейчас он трогает теги пытаясь их переводить. Например, <chanel> переведет как <канал>. Это можно было бы решить введя список стоп-слов которые парсеру не нужно переводить. В этот список стоп слов как раз можно все теги запихнуть. Это была бы очень полезная доработка... Или может можно как то найти выход по другому?
 
Последнее редактирование:
Данный JS парсер берет содержимое всего файла и отправляет его в deepl на перевод. Стандартный парсер берет построчно из файлов строки и отправляет их на перевод. Ни один из этих парсеров не разрезает и не указывает какую часть строки переводить, а какую нет и добавить это в данные парсеры нет возможности.
Вы можете попробовать реализовать собственную обертку вокруг стандартного парсера (в виде пресета или JS парсера) и формировать запросы в deepl без тегов. Но основная проблема - как парсер должен понять куда именно и какие теги вставлять уже в переведенную строку?
 
Данный JS парсер берет содержимое всего файла и отправляет его в deepl на перевод. Стандартный парсер берет построчно из файлов строки и отправляет их на перевод. Ни один из этих парсеров не разрезает и не указывает какую часть строки переводить, а какую нет и добавить это в данные парсеры нет возможности.
Вы можете попробовать реализовать собственную обертку вокруг стандартного парсера (в виде пресета или JS парсера) и формировать запросы в deepl без тегов. Но основная проблема - как парсер должен понять куда именно и какие теги вставлять уже в переведенную строку?

Я вам написал в платную поддержку.

Еще вопрос. Можно ли как то подавать на вход (для последующего перевода) DOCX файлы? У меня пресет данный тип файлов не обрабатывает.
 
Думаю можно, если использовать в JS парсере какой-то модуль, который реализует работу с docx.
Вы можете сделать этот модуль? Платно? Если да, то сколько времени вам надо и сколько будет стоить. Единственное, что мне надо еще - чтобы разметка которая есть в исходном docx сохранялась и в выходном (переведенном) docx. То есть переводится должен текст, а все выделения жирным, списки, заголовки - все это должно сохраняться.
 
Вы можете сделать этот модуль? Платно?
Модуль точно нет, JS парсер с использованием такого модуля - возможно. Не уверен что получится еще и разметку сохранять, хотя тут все зависит от используемого модуля и нужного алгоритма реализации. Для заказа подготовьте подробное ТЗ и направьте по одному из контактов Платной поддержки: http://a-parser.com/threads/1795/
 
Данный JS парсер берет содержимое всего файла и отправляет его в deepl на перевод. Стандартный парсер берет построчно из файлов строки и отправляет их на перевод. Ни один из этих парсеров не разрезает и не указывает какую часть строки переводить, а какую нет и добавить это в данные парсеры нет возможности.
Вы можете попробовать реализовать собственную обертку вокруг стандартного парсера (в виде пресета или JS парсера) и формировать запросы в deepl без тегов. Но основная проблема - как парсер должен понять куда именно и какие теги вставлять уже в переведенную строку?

Вы сможете реализовать мое пожелание по переводу XML? Я отправлял запрос платный, но со мной никто не связался. Мне как заказчику непонятно - сколько ждать и ждать ли вообще (Я не вижу статус своего заказа - на рассмотрении он, принят к рассмотрению и т.д). Реализумо ли это вприципе и если да то за какую цену.
 
Посмотрите правильно нет вот такойже на яндекс может кому пригодится
Код:
eJx9Vdtu4zYQ/RWCMCC7EBSnQIFCQR6yQQzsNo3TdfahsA2HkShHuzSpJSk3hqB/
7wx1s2V5+cTLzJkzVxbUMvPDPGtuuDU0XBY0c3sa0n+ZjPlHGL5oJo1gVulZKrih
Ps2YNlyj+JJ+WYRhJenk4DXmCcuFpX5B7SHjgKT2XOs05vCYxnBePGwqlU2DzTe1
WZ/umci5E2qAOwp88/C0eZrT8jJ2ptXHQXOrU0e1QbueTmm5XvsUzAA5M1N6x9DL
UXYd2AY+pq3Agu35iwKBBJzurjEET2yHkJ3WlYHggL0gUrurUQGIqCRBrARNFsep
TZVkojKKceuIfJPpT8dQKpCFLQLNtNqhBf5h68tDQ3hJR+5MASJ3uv9UOjRMmDDc
pwaYzxgQiPsvqeUa8zjPkA/cF1TJOyEe+Z6LTszhf8pTEUOS7xJQ+lwrDovMzzDK
1r1jU5Cp/zRwoKHVOYC4w6f5351SrB7VtomFSHephbO5V7nEVE3h8gfnWRuyJxTb
Kc1bKzW92jiUdcYlVkWXwLusuzrx4iQrp5eRkkm6ndeV1kjm8gV6Zy7v1S4THN2S
uRCQFcO/dsVyZ+os4KEj2Fe+dyaAVts91ColzJdFRTXTKRTjH0hwB4E8tlpDRkyI
b18fj19oV1FwqF1brY6qdbWiqGn5VkFJgV/lum3vdigUZ00eFiVk67t5riSruTAo
R4+OwXekAcE0liSG3BLNf+ap5mMvMd7kZiVXMhLMGFLBkmIlCSynoPMIWI8nzSUu
+56aoI4Xxg8Qj15xQcYMFEZIvGlwHfzu+afPdUTCvhquBDo7JMvzB1xLDyK4TaGl
PZ9483qPTC2X4By0L8ER4K39SwDd9ECIdsDFDcgvVJvhgoqzZj8kvj69Kofd3yRu
tECQRh2pFSzZj9fluQ3KdSK8TqV0KW1OLlscRiF7E7xOVy+8S++yBXB26UHFvqk3
9YGeD/4PpBZeH4djfVPty4bOb67CxyDoN0E4Kaw0IfgYiL0gt7e3ZDrpV0itFSz+
+vwMflzfDD+bPIq4MQMSdRdg48BrYgLN8Z/Qi4OMnG03myY9LRdDobZbroMst+PX
GYzGmIwKBxRAKWzte1nBvk5Owo8LEk3GMBpIU0FEJZXwmYOtNccjAG7jgrh9SF5H
RcuwvKqMu8/u1e+Qyz738qgwjonBr8EvhbdFuyVosTn2o6IPQ/QbkKZVuzhj05wG
Guopt8mfXp/0YNAXVVYTmPYHgngEP2pSRR9DOir6ttvURO9Mswi+06H84ML0gHYG
bA8pF3FlvhrJAQ5Mbux4uPihK5wwflfB5U7ySVH6Z9EZ8jxNxkglSGWimlqetJrd
sHCjHOS6mwGw8544w+5XDDk99zqI2eh9zC9X7nHKHrRWOoTE8GAHhtgWinXI43OS
01+Wcadncy0b9W7elBQ/yvobouF1+T98waFW
 
Назад
Верх