HTML::LinkExtractor

  • Автор темы Автор темы Ban
  • Дата начала Дата начала

Ban

A-Parser Enterprise License
A-Parser Enterprise
Код:
 $options = array(
            'parsers' => array(
                array(
                    'HTML::LinkExtractor',
                    'minimal',
                    array(
                        'type' => 'override',
                        'id' => 'formatresult',
                        'value' => '$intlinks.format(\'$query.id:::$link\\n\')',
                    ),
                    array(
                        'type' => 'unique',
                        'result' => array(
                            'intlinks',
                            'link',
                        ),
                        'uniqueType' => 'string',
                        'uniqueGlobal' => true,
                    ),
                ),

            ),
            'resultsFormat' => '$p1.preset',
            'resultsUnique' => 'string',
            'resultsFileName' => 'link/' . now() . ".txt",
//            'keepUnique' => 'No',
            'saveFailedQueries' => 'Yes',

//            "doLog" => "db",

            'queryFormat' => array(
                '$query'
            ),
            'queryBuilders' => array(
                array(
                    'source' => 'query',
                    'type' => 'stringSplit',
                    'separator' => ':::',
                    'to' => array(
                        'id',
                        'query'
                    )

                ),
            )
        );
2XMcl3Dd6Hm2pyHCaANzzmr8t1y54u

Результатов уникальных больше, чем просто результатов.
 
Последнее редактирование:
Две уникализации включено: по строке и по любому результату, поэтому кол-во уникальных больше. При этом файл результата будет правильный.
 
Назад
Верх