Улучшение HTML::TextExtractor::LangDetect - определение языка фраз

  • Автор темы Автор темы LmPopo
  • Дата начала Дата начала

LmPopo

A-Parser Pro License
A-Parser Pro
Добавить бы, если возможно, определение языка подсунутых строк из файла.
 
парсер парсит сайты а не читает файлы :)
 
Это да, но что делать теперь, коли есть насущная необходимость? ))
 
Ответ очевиден, создать на сайте необходимые файлы ;)
P.s. юзай localhost
 
Ответ очевиден, создать на сайте необходимые файлы ;)
P.s. юзай localhost
Прибегаю к такого рода необязательным связкам только в случае вынужденной необходимости )

Ну а по теме: создал вчера 2 пересета, 1 - опеределялка через гугл, второй - бинг.
Думал использовать SE::Bing::Translator с Raw data, но медленно работает и много бедов, т.к. похоже делает всё время 2 запроса - первым получает appid, а вторым уже работает с фразой, создал на основе net http, скорость около 20к с минимум фейлов, просто работает с одним appid. Предложение оставлять не буду, т.к. мне и так хорошо, но можно было бы добавить в SE::Bing::Translator опцию "Свой appid".

Да и чем плохо добавить категорию парсеров для работы с локальными файлами?? Просто анонсировать это подготовительным этапом до начала парсинга.
Напр., определив языки фраз, затем парсим подсказки по нужным странам.
И можно много чего придумать, надо только заложить фундамент, отринув суеверия, предубеждения, общепринятое, что парсер только парсит; а может он в детстве мечтал стать космонавтом! :D
 
Назад
Верх