1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

Улучшение Обработка готовых баз

Тема в разделе "Задачи", создана пользователем dady, 31 май 2013.

?

Нужно?

  1. Да

    39 голосов
    95,1%
  2. нет

    2 голосов
    4,9%
  3. Всё равно

    0 голосов
    0,0%
  1. dady

    dady A-Parser Pro License
    A-Parser Pro

    Регистрация:
    18 май 2013
    Сообщения:
    4
    Симпатии:
    3
    Было бы отлично если бы присутствовали тулузы для работы с базами, удаление дублей (по линку \ по домену \ по регулярке) , обьединение, удаление или замена текста по реглярке, и прочее. Из имеющегося в паблике софта 99% не могут работать с огромными базами в мильёны строк остальные сложные в настройке ну и собсно хочется иметь всё в одном.
     
    stanbochkarev, limoshkaa и nouton нравится это.
  2. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    скидывайте сюда все необходимые варианты обработки базы
     
  3. shank

    shank A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    14 мар 2013
    Сообщения:
    16
    Симпатии:
    1
    Удаление дублей (полностью по строке, по домену, по урлу до параметров и т.д.)
    Объединение баз
    Перемешивание
    Сортировка по алфавиту
    Разбивка по количеству строк/частей
    Выборка из по списку слов (есть вхождение/нет вхождения)
    Создание базы С, содержащей только ссылки из базы А и Б (Пересечение)
     
    Max нравится это.
  4. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    еще:
    вычитание базы: из A вычесть B и получить C
     
    limoshkaa нравится это.
  5. shank

    shank A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    14 мар 2013
    Сообщения:
    16
    Симпатии:
    1
    да, точно, тоже бывает необходимо :)
     
  6. Dodgy

    Dodgy A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    14 сен 2012
    Сообщения:
    65
    Симпатии:
    4
    Выборка баз сайтов по регулярке, например, мне нужны с базы выбрать только домены 3-го уровня, или удалять домены с 2/3 и тд вложениями http://site.ru/soft/dorwey/blia.html или выбрать с одним)
     
  7. kesn

    kesn A-Parser Pro License
    A-Parser Pro

    Регистрация:
    9 дек 2012
    Сообщения:
    4
    Симпатии:
    1
    +1 хорошая тулза получилась бы!
     
  8. dady

    dady A-Parser Pro License
    A-Parser Pro

    Регистрация:
    18 май 2013
    Сообщения:
    4
    Симпатии:
    3
    Удаление теста по регулярке обязательно надо.
     
  9. KongWei

    KongWei A-Parser Pro License
    A-Parser Pro

    Регистрация:
    27 май 2012
    Сообщения:
    8
    Симпатии:
    5
    Можно даже слева отдельную кнопку сделать для работы с результатами и там бы еще пригодились опции касательно файлов
    удалить
    скопировать в queries
    скачать
    т.к. сейчас задание может уползти далеко, а файл остался
     
  10. Stinger

    Stinger A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    21 мар 2012
    Сообщения:
    12
    Симпатии:
    6
    1. Удаление всех строк с указанными словами/фразами + наоборот же оставить все строки с ними и сохранить в отдельный файл.

    2. Удаление всех строк длиннее ХХ символов или же наоборот.

    3. Раздублить по доменам и урезать все строки до домена например.
     
    Force68 нравится это.
  11. aquatell

    aquatell A-Parser Pro License
    A-Parser Pro

    Регистрация:
    8 ноя 2012
    Сообщения:
    150
    Симпатии:
    43
    Ребята вот вам тулза уже готовая , функционал супер _http://newox.ru/kwk.php ограничение строк ~ 20 лямов думаю этого более чем достаточно.
    Утилитка без вирусов, на вирус тотал определяется некоторыми как троян, ну это бред, мне эта утитита тоже стала интересна и я ее отправил на исследование в несколько антивирусных лабораторий, пришел отчет - все чисто, так что не сцо )) юзайте.
     
  12. Dodgy

    Dodgy A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    14 сен 2012
    Сообщения:
    65
    Симпатии:
    4
    Внедрить бы в квк регулярки была б незаменима)
     
  13. dady

    dady A-Parser Pro License
    A-Parser Pro

    Регистрация:
    18 май 2013
    Сообщения:
    4
    Симпатии:
    3
    Вроде ещё не делали? В планах есть? :)
     
  14. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    конечно есть :)
     
  15. Lynxx

    Lynxx A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    2 мар 2013
    Сообщения:
    17
    Симпатии:
    1
    вот удаление дублей точно нужно
     
  16. kesn

    kesn A-Parser Pro License
    A-Parser Pro

    Регистрация:
    9 дек 2012
    Сообщения:
    4
    Симпатии:
    1
    Было бы неплохо еще такую фичу сделать, обработка спарсеренного по блек листу
     
    limoshkaa нравится это.
  17. vipuncle

    vipuncle A-Parser Pro License
    A-Parser Pro

    Регистрация:
    7 апр 2015
    Сообщения:
    125
    Симпатии:
    42
    Менеджер готов уже, если да, то где скачать\купить?
     
  18. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.336
    Симпатии:
    1.791
    не готов, он будет в составе A-Parser
     
  19. d4k

    d4k A-Parser Pro License
    A-Parser Pro

    Регистрация:
    28 авг 2013
    Сообщения:
    41
    Симпатии:
    6
  20. Zlodeys

    Zlodeys A-Parser Pro License
    A-Parser Pro

    Регистрация:
    2 фев 2016
    Сообщения:
    51
    Симпатии:
    30
    что за софт на скрине?
     

Поделиться этой страницей