1. Этот сайт использует файлы cookie. Продолжая пользоваться данным сайтом, Вы соглашаетесь на использование нами Ваших файлов cookie. Узнать больше.
  2. Вступайте в наш Telegram чат: https://t.me/a_parser Нас уже 2600+ и мы растем!
    Скрыть объявление

формат результата

Тема в разделе "Техническая поддержка", создана пользователем heart, 30 окт 2014.

  1. heart

    heart A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 сен 2014
    Сообщения:
    10
    Симпатии:
    0
    есть задача спарсить некоторые внутренние ссылки на страницах фейсбук. Эти ссылки 2-х типов (используется 2 регулярки для парсинга этих ссылок). Вопрос как сделать чтобы ссылки одного типа сохранялись в одном столбце, а ссылки другого типа сохранялись в другом столбце. Бывают ситуации когда на странице присутствуют ссылки только одного типа. Я пытаюсь делать как на скрине, но результат сохраняется криво, ссылки 2-х типов перемешиваются и некоторые результаты сохраняются в 3-4 столбцы..
    upload_2014-10-30_3-9-8.png
     
  2. heart

    heart A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 сен 2014
    Сообщения:
    10
    Симпатии:
    0
    используется NET:HTTP
     
  3. heart

    heart A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 сен 2014
    Сообщения:
    10
    Симпатии:
    0
    полный скрин
    upload_2014-10-30_3-14-26.png
     
  4. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.796
    не совсем понятно о каких столбцах речь, пример бы
     
  5. heart

    heart A-Parser Enterprise License
    A-Parser Enterprise

    Регистрация:
    25 сен 2014
    Сообщения:
    10
    Симпатии:
    0
    на странице есть html блоки со ссылками внутри
    1 тип (пример): <div class="_6a _6b"><strong><a href="http://www.facebook.com/pages/A-H-Cellular/109751795719557" title="A &amp; H Cellular">A &amp; H Cellular</a></strong><div class="fsm fwn fcg">Company</div></div>

    2 тип (пример): <li class="fbDirectoryBoxColumnItem"><a href="https://www.facebook.com/directory/pages/A-1-139440">A - A LA VOZ DEL CARNAVAL, TODO EL MUNDO SE LEVANTA</a></li>

    бывают ситуации когда на страницах блоки с нужными ссылками только или 1-го типа, или 2-го

    мне нужно получить exel файл в котором первый столбец будут занимать url адреса с блоков 1-го типа, а во втором столбце того же файла будут находиться url адреса с блоков 2-го типа.

    я пытался делать как на скрине выше, url парсятся, но результат сохраняется не так.
     
  6. Forbidden

    Forbidden Administrator
    Команда форума A-Parser Enterprise

    Регистрация:
    9 мар 2013
    Сообщения:
    3.337
    Симпатии:
    1.796
    [​IMG]

    Формат результата:
    Код:
    [%
      max = links1.size;
      max = links2.size IF max < links2.size;
      max = max - 1;
      FOREACH i = [0..max];
        '"' _ links1.$i.link _ '", "' _ links2.$i.link _ '"' _ "\n";
      END;
    %]
    Вкратце: определяем каких ссылок получилось больше и выводим максимальное число строк
     

Поделиться этой страницей