Настройка парсинга

  • Автор темы Автор темы Mik
  • Дата начала Дата начала

Mik

A-Parser Pro License
A-Parser Pro
Добрый день.

Помогите пожалуйста настроить малтипл парсинг по нескольким парсерам.

Я хочу парсить выдачу гугла http://a-parser.com/wiki/se-google/,

затем парсить по получающимся страницам http://a-parser.com/wiki/se-google-pr/ Pr полученных страниц и доменов,

и по доменам этих страниц парсить еще категорию сайта http://a-parser.com/wiki/rank-category/,

и еще по этим доменам парсить количество трафика http://a-parser.com/wiki/rank-mustat/

Заранее спасибо.
 
1) Отдельным заданием парсим линки из Гугла:
Q9liW.png

Код:
eyJwcmVzZXQiOiJodHRwOi8vYS1wYXJzZXIuY29tL3RocmVhZHMvMTY2Ny8gLSBc
dTA0M2ZcdTA0MzBcdTA0NDBcdTA0NDFcdTA0MzhcdTA0M2MgXHUwNDNiXHUwNDM4
XHUwNDNkXHUwNDNhXHUwNDM4IiwidmFsdWUiOnsicHJlc2V0IjoiaHR0cDovL2Et
cGFyc2VyLmNvbS90aHJlYWRzLzE2NjcvIC0gXHUwNDNmXHUwNDMwXHUwNDQwXHUw
NDQxXHUwNDM4XHUwNDNjIFx1MDQzYlx1MDQzOFx1MDQzZFx1MDQzYVx1MDQzOCIs
InBhcnNlcnMiOltbIlNFOjpHb29nbGUiLCJkZWZhdWx0Il1dLCJyZXN1bHRzRm9y
bWF0IjoiJHAxLnByZXNldCIsInJlc3VsdHNTYXZlVG8iOiJmaWxlIiwicmVzdWx0
c0ZpbGVOYW1lIjoiZ29vZ2xlbGluay50eHQiLCJhZGRpdGlvbmFsRm9ybWF0cyI6
W10sInJlc3VsdHNVbmlxdWUiOiJubyIsInF1ZXJ5Rm9ybWF0IjpbIiRxdWVyeSJd
LCJ1bmlxdWVRdWVyaWVzIjpmYWxzZSwic2F2ZUZhaWxlZFF1ZXJpZXMiOmZhbHNl
LCJpdGVyYXRvck9wdGlvbnMiOnsib25BbGxMZXZlbHMiOmZhbHNlLCJxdWVyeUJ1
aWxkZXJzQWZ0ZXJJdGVyYXRvciI6ZmFsc2V9LCJyZXN1bHRzT3B0aW9ucyI6eyJv
dmVyd3JpdGUiOmZhbHNlfSwiZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJObyIs
Im1vcmVPcHRpb25zIjpmYWxzZSwicmVzdWx0c1ByZXBlbmQiOiIiLCJyZXN1bHRz
QXBwZW5kIjoiIiwicXVlcnlCdWlsZGVycyI6W10sInJlc3VsdHNCdWlsZGVycyI6
W10sImNvbmZpZ092ZXJyaWRlcyI6W119fQ==

2) Вторым заданием парсим необходимую информацию из разных парсеров, подставив в качестве файла запросов файл, полученный в первом задании:
jGabO.png

Код:
eyJwcmVzZXQiOiJodHRwOi8vYS1wYXJzZXIuY29tL3RocmVhZHMvMTY2Ny8gLSBc
dTA0M2ZcdTA0MzBcdTA0NDBcdTA0NDFcdTA0MzhcdTA0M2RcdTA0MzMgXHUwNDM4
XHUwNDNkXHUwNDQ0XHUwNDNlXHUwNDQwXHUwNDNjXHUwNDMwXHUwNDQ2XHUwNDM4
XHUwNDM4IiwidmFsdWUiOnsicHJlc2V0IjoiaHR0cDovL2EtcGFyc2VyLmNvbS90
aHJlYWRzLzE2NjcvIC0gXHUwNDNmXHUwNDMwXHUwNDQwXHUwNDQxXHUwNDM4XHUw
NDNkXHUwNDMzIFx1MDQzOFx1MDQzZFx1MDQ0NFx1MDQzZVx1MDQ0MFx1MDQzY1x1
MDQzMFx1MDQ0Nlx1MDQzOFx1MDQzOCIsInBhcnNlcnMiOltbIlNFOjpHb29nbGU6
OlBSIiwiZGVmYXVsdCIseyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6InF1ZXJ5Zm9y
bWF0IiwidmFsdWUiOiIkcXVlcnkuZG9tYWluIn1dLFsiU0U6Okdvb2dsZTo6UFIi
LCJkZWZhdWx0Iix7InR5cGUiOiJvdmVycmlkZSIsImlkIjoicXVlcnlmb3JtYXQi
LCJ2YWx1ZSI6IiRxdWVyeSJ9XSxbIlJhbms6Ok11c3RhdCIsImRlZmF1bHQiLHsi
dHlwZSI6Im92ZXJyaWRlIiwiaWQiOiJxdWVyeWZvcm1hdCIsInZhbHVlIjoiJHF1
ZXJ5LmRvbWFpbiJ9XSxbIlJhbms6OkNhdGVnb3J5IiwiZGVmYXVsdCIseyJ0eXBl
Ijoib3ZlcnJpZGUiLCJpZCI6InF1ZXJ5Zm9ybWF0IiwidmFsdWUiOiJodHRwOi8v
JHF1ZXJ5LmRvbWFpbiJ9XV0sInJlc3VsdHNGb3JtYXQiOiIkcXVlcnkgLSBQUjog
JHAyLnByKCRwMS5wciksIENhdGVnb3J5OiAkcDQuY2F0ZWdvcnksIFRyYWZmaWM6
ICRwMy50cmFmZmljXFxuIiwicmVzdWx0c1NhdmVUbyI6ImZpbGUiLCJyZXN1bHRz
RmlsZU5hbWUiOiJnb29nbGVyZXN1bHQudHh0IiwiYWRkaXRpb25hbEZvcm1hdHMi
OltdLCJyZXN1bHRzVW5pcXVlIjoibm8iLCJxdWVyeUZvcm1hdCI6WyIkcXVlcnki
XSwidW5pcXVlUXVlcmllcyI6ZmFsc2UsInNhdmVGYWlsZWRRdWVyaWVzIjp0cnVl
LCJpdGVyYXRvck9wdGlvbnMiOnsib25BbGxMZXZlbHMiOmZhbHNlLCJxdWVyeUJ1
aWxkZXJzQWZ0ZXJJdGVyYXRvciI6ZmFsc2V9LCJyZXN1bHRzT3B0aW9ucyI6eyJv
dmVyd3JpdGUiOmZhbHNlfSwiZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJObyIs
Im1vcmVPcHRpb25zIjpmYWxzZSwicmVzdWx0c1ByZXBlbmQiOiIiLCJyZXN1bHRz
QXBwZW5kIjoiIiwicXVlcnlCdWlsZGVycyI6W3sic291cmNlIjoicXVlcnkiLCJ0
eXBlIjoiZXh0cmFjdERvbWFpbiIsInRvIjoiZG9tYWluIn1dLCJyZXN1bHRzQnVp
bGRlcnMiOltdLCJjb25maWdPdmVycmlkZXMiOltdfX0=

В результате мы получим файл в котором в каждой строке будет: исходный линк, PR линка, в скобках PR домена, категория и трафик

P.S. На данный момент не работает сервис по определению категорий, поэтому парсер не сможет с него получить информацию. Если нужно работать без него, тогда просто удаляем 4-й парсер (Rank::Category) и в формате результата убираем его упоминание: $query - PR: $p2.pr($p1.pr), Category: $p4.category, Traffic: $p3.traffic\n
 
  • Like
Реакции: Max
Назад
Верх