Как отключить переходы по ссылкам в HTML::LinkExtractor

bezenkovgl

A-Parser Enterprise License
A-Parser Enterprise
Здравствуйте. Стоит задача узнать количество внутрених и исходящих ссылок со странице.
Для этого использую переменные $intcount $extcount из парсера указаного в заголовке. Мне нужно только информация о количестве ссылок с индексной странице, b не нужно что парсер по этим ссылкам переходил.

Очень надеюсь на помощь!
 
Здравствуйте.
Количество внутренних ссылок на странице можно узнать из переменной $intcount, а внешних из $extcount.
Переопределив Result format таким образом $intcount - $extcount , мы получим количество внутренних ссылок дефис количество внешних.
Чтобы не переходить дальше по ссылкам не включайте Parse to level
 
Последнее редактирование:
Спасибо с этим разобрался. Встала другая проблема - настроил фильтры на условие что $intcount > $extcount, но в файл результатов все равно записываются результаты где $intcount <= $extcount
 
Вот
 

Вложения

  • Снимок экрана от 2017-08-09 23-18-05.png
    Снимок экрана от 2017-08-09 23-18-05.png
    105,5 КБ · Просмотры: 11
скиньте код пресета.
И несколько запросов. Чтобы потестировать.
 
Код:
eyJwcmVzZXQiOiJDaGVja19kb21fc3RlcF8xIiwidmFsdWUiOnsicHJlc2V0Ijoi
Q2hlY2tfZG9tX3N0ZXBfMSIsInBhcnNlcnMiOltbIkhUTUw6OlRleHRFeHRyYWN0
b3I6OkxhbmdEZXRlY3QiLCJkZWZhdWx0Iix7InR5cGUiOiJmaWx0ZXIiLCJyZXN1
bHQiOiJsYW5nIiwiZmlsdGVyVHlwZSI6ImVxdWFsIiwidmFsdWUiOiJFTkdMSVNI
Iiwib3B0aW9uIjoic2VucyJ9LHsidHlwZSI6ImZpbHRlciIsInJlc3VsdCI6Ilsl
ICB0ZXh0cy5mb3JtYXQoJyR0ZXh0JykubGVuZ3RoOyAgJV0iLCJmaWx0ZXJUeXBl
IjoiPiIsInZhbHVlIjoiOTAwIiwib3B0aW9uIjoic2VucyJ9LHsidHlwZSI6ImZp
bHRlciIsInJlc3VsdCI6ImNvZGUiLCJmaWx0ZXJUeXBlIjoiZXF1YWwiLCJ2YWx1
ZSI6IjIwMCIsIm9wdGlvbiI6InNlbnMifSx7InR5cGUiOiJvdmVycmlkZSIsImlk
IjoiZm9ybWF0cmVzdWx0IiwidmFsdWUiOiIkcXVlcnk6OlslICB0ZXh0cy5mb3Jt
YXQoJyR0ZXh0JykubGVuZ3RoOyAgJV0ifV0sWyJOZXQ6Oldob2lzIiwiVXNlIFBy
b3h5Iix7InR5cGUiOiJvdmVycmlkZSIsImlkIjoiZm9ybWF0cmVzdWx0IiwidmFs
dWUiOiIkZXhwaXJlX2RhdGUifV0sWyJIVE1MOjpMaW5rRXh0cmFjdG9yIiwiZGVm
YXVsdCIseyJ0eXBlIjoiZmlsdGVyIiwicmVzdWx0IjoiaW50Y291bnQiLCJmaWx0
ZXJUeXBlIjoiPiIsInZhbHVlIjoiJGV4dGNvdW50Iiwib3B0aW9uIjoic2VucyJ9
LHsidHlwZSI6Im92ZXJyaWRlIiwiaWQiOiJmb3JtYXRyZXN1bHQiLCJ2YWx1ZSI6
IiRpbnRjb3VudDo6JGV4dGNvdW50XFxuIn1dXSwicmVzdWx0c0Zvcm1hdCI6IiRw
MS5wcmVzZXQ6OiRwMi5wcmVzZXQ6OiRwMy5wcmVzZXQiLCJyZXN1bHRzU2F2ZVRv
IjoiZmlsZSIsInJlc3VsdHNGaWxlTmFtZSI6Imdvb2RfZG9tYWluLnR4dCIsImFk
ZGl0aW9uYWxGb3JtYXRzIjpbXSwicmVzdWx0c1VuaXF1ZSI6Im5vIiwicXVlcmll
c0Zyb20iOiJmaWxlIiwicXVlcnlGb3JtYXQiOlsiaHR0cDovLyRxdWVyeSJdLCJ1
bmlxdWVRdWVyaWVzIjpmYWxzZSwic2F2ZUZhaWxlZFF1ZXJpZXMiOnRydWUsIml0
ZXJhdG9yT3B0aW9ucyI6eyJvbkFsbExldmVscyI6ZmFsc2UsInF1ZXJ5QnVpbGRl
cnNBZnRlckl0ZXJhdG9yIjpmYWxzZSwicXVlcnlCdWlsZGVyc09uQWxsTGV2ZWxz
IjpmYWxzZX0sInJlc3VsdHNPcHRpb25zIjp7Im92ZXJ3cml0ZSI6ZmFsc2V9LCJk
b0xvZyI6Im5vIiwia2VlcFVuaXF1ZSI6Ik5vIiwibW9yZU9wdGlvbnMiOmZhbHNl
LCJyZXN1bHRzUHJlcGVuZCI6IiIsInJlc3VsdHNBcHBlbmQiOiIiLCJxdWVyeUJ1
aWxkZXJzIjpbXSwicmVzdWx0c0J1aWxkZXJzIjpbXSwiY29uZmlnT3ZlcnJpZGVz
IjpbXSwicnVuVGFza09uQ29tcGxldGUiOm51bGwsInVzZVJlc3VsdHNGaWxlQXNR
dWVyaWVzRmlsZSI6ZmFsc2UsInJ1blRhc2tPbkNvbXBsZXRlQ29uZmlnIjoiZGVm
YXVsdCIsInRvb2xzSlMiOiJUb29scy5wcm90b3R5cGUuZ2V0Qnl0ZXMxID0gZnVu
Y3Rpb24oc3RyKSB7XG4gICAgcmV0dXJuIHVuZXNjYXBlKGVuY29kZVVSSUNvbXBv
bmVudChzdHIpKS5sZW5ndGg7XG59XG5cblRvb2xzLnByb3RvdHlwZS5nZXRCeXRl
czIgPSBmdW5jdGlvbihzdHIpIHtcbiAgIHZhciBsZW5ndGggPSBzdHIubGVuZ3Ro
LCBjb3VudCA9IDAsIGkgPSAwLCBjaCA9IDA7XG4gICBmb3IoaTsgaSA8IGxlbmd0
aDsgaSsrKXtcbiAgICAgY2ggPSBzdHIuY2hhckNvZGVBdChpKTtcbiAgICAgaWYo
Y2ggPD0gMTI3KXtcbiAgICAgICAgY291bnQrKztcbiAgICAgfWVsc2UgaWYoY2gg
PD0gMjA0Nyl7XG4gICAgICAgIGNvdW50ICs9IDI7XG4gICAgIH1lbHNlIGlmKGNo
IDw9IDY1NTM1KXtcbiAgICAgICAgY291bnQgKz0gMztcbiAgICAgfWVsc2UgaWYo
Y2ggPD0gMjA5NzE1MSl7XG4gICAgICAgIGNvdW50ICs9IDQ7XG4gICAgIH1lbHNl
IGlmKGNoIDw9IDY3MTA4ODYzKXtcbiAgICAgICAgY291bnQgKz0gNTtcbiAgICAg
fWVsc2V7XG4gICAgICAgIGNvdW50ICs9IDY7XG4gICAgIH0gICAgXG4gIH1cbiAg
cmV0dXJuIGNvdW50O1xufSIsInByaW8iOjUsInF1ZXJpZXNGaWxlIjpbImFsbF8w
OS4wOC4yMDE3LnR4dCJdfSwicGFyc2Vyc0NvbmZQcmVzZXRzIjp7Ik5ldDo6V2hv
aXMiOnsiVXNlIFByb3h5Ijp7InF1ZXJ5Zm9ybWF0IjoiJHF1ZXJ5IiwicHJveHly
ZXRyaWVzIjoiMTAiLCJwcm94eUNoZWNrZXIiOiIqIiwicmVxdWVzdGRlbGF5Ijow
LCJwcm94eWJhbm5lZGNsZWFudXAiOjE4MDAsImZvcm1hdHJlc3VsdCI6IiRxdWVy
eSAtICRyZWdpc3RlcmVkIC0ge2V4cGlyZV9kYXRlfVxcbiIsInJlY3Vyc2UiOjAs
InRpbWVvdXQiOjYwLCJzZXJ2ZXIiOiIiLCJ1c2Vwcm94eSI6dHJ1ZSwibWF4X3Np
emUiOjEwNDg1NzZ9fX19
 
Код:
http://SMZB.COM::1516::11.08.2017::2::6
http://SMOOTHEDOUT.COM::8036::11.08.2017::42::33
http://SMSPDU.COM::1733::11.08.2017::3::2
http://SNOGGZ.COM::3063::11.08.2017::21::21
http://SOBERSYNDICATE.COM::2218::11.08.2017::10::5
http://SMOKABBQ.COM::14015::11.08.2017::46::6
http://SNEHASISHDESIGN.COM::1984::11.08.2017::109::3
http://SNEAKYCHARLES.COM::2385::11.08.2017::1::158

файл результата, последние две цыфры соответсвенно intcount и extcount
 
SMZB.COM
SMOOTHEDOUT.COM
SMSPDU.COM
SNOGGZ.COM
SOBERSYNDICATE.COM
SMOKABBQ.COM
SNEHASISHDESIGN.COM
SNEAKYCHARLES.COM
 
Назад
Верх