JS::TextFromSE

JS::TextFromSE 2.0

Available for license holders
Минимальная версия A-Parser
1.2.1432
  • Данный парсер - это пример обьединения парсера поисковой выдачи и парсера текста в одном
  • Есть возможность выбрать ПС: Google или Яндекс
  • Для выбранной ПС и парсера текста можно задать собственные пресеты настроек. Тем самым можно регулировать кол-во ссылок, по которым будет парситься текст, а также настроить парсер текста (задать минимальный размер блока, юзер агент и т.п.) Пример такой настройки:
    suDUw.png
  • В результат выводится ключ, ссылка и текст. Текст никак дополнительно не чистится, можно использовать Конструктор результатов как в обычном парсере текста
  • Алгоритм работы:
    • По ключу из выбранного поисковика парсятся ссылки
    • Полученные ссылки передаются в HTML::TextExtractor для получения текста
    • С помощью this.query.add ссылки распределяются по потоках, для равномерной нагрузки
Автор
Support Ilia
Загрузок
273
Просмотры
273
Первый выпуск
Обновление

Рейтинги

0,00 звёзд Оценок: 0

Ещё ресурсы от Support Ilia

Последние обновления

  1. Обновление 2.0

    Парсер переписан на JavaScript API v2
  2. Обновление 1.4.0

    Добавлена опция выбора текстового парсера (ArticleExtractor/TextExtractor) SE::Google::Modern...
  3. Обновление 1.3.0

    Парсер Гугла заменен на SE::Google::Modern
Назад
Верх