Пройтись по страницам и вытащить контент. Что делаю не так?

  • Автор темы Автор темы sergeda
  • Дата начала Дата начала

sergeda

A-Parser Enterprise License
A-Parser Enterprise
Screenshot from 2018-07-04 11-45-56.png

eJxtVNtO20AQ/ZcVEkREcVOVh1qUKkVKL0IkQHhKUrTYY7NlvbvsrhMiy//eGd+h
ffNcz5kz4y2Y5+7ZLS048I6F64KZ6puF7Dv4ewd2loLC0JgZbtGkpDW7Bh+GP1ar
JfpjSHguPRsXzB8MYKU2XmhFNSJGM3ew5CmQveMyp4wpfvM4FpTHJQsRljLuPJgm
Snakc0VMPn76fMbKcgCwA2tFDC3CSw72kGibcT8AOarcRwW1UnlWsnK7HTMcD9m6
eZ2NWWY64dWMk7rDyfFRZW826njEuoI7voOVxoJESOjdc7SueVbhxdwDRdtGo4l/
9W8mrVFJw57JvRIvFV+lMZc4C3BzqzN0eagaVIO0jNfNYAxb5FXtTV3DwoRLB2Pm
kOqcI5H4fUR4sNxru2g2hMJrNZPyCnYg+7Sq/7dcyBgXPkuw6GdT+P+UxT89ym68
IRSubW+RQ58U6yudtrM/A5hOjWvyZNpC16BBbvrizRpQtP1+GTPTu94QfCP4wFkw
p3MbId76w3hdHyGdNPec0bE092YhhVdapLX8gDZv/4k6ELJIcue+bOjUbX087OKc
r39fbE8vTianX0fnm03A24JV3TVF22taaFXCtiUiRlolIl00B94Sz9UK/9OFutSZ
kUACqlzKMeHd9nc4c82+yej1el98WUEgge7PRRpaul93tXLGCmR1RmQzXNkQtWkZ
cSnvb6+GEdbfLhpP3hsXBkFMN6ENij3ZP3EvXHZ4tHqPKk0inQWdXC6AVyNx2cET
t/GeW3gg6R+cgUgkIgoy/YgzBYywPaQazx+VIcGaZ6l7worB4xQW+GqwP25Z55As
lIE+1NfhVbFwWv4FkSDANg==
 
Да, в целом пресет рабочий. Но можно сделать несколько улучшений:
  • добавить проверку по коду ответа (Good status) - парсер будет повторять запрос, если получит код ответа, отличный от указанного (200)
  • вместо Use pages лучше использовать Check next page + Page as new query - это позволит не накапливать все страницы в памяти, а обрабатывать их сразу по мере получения, а также не нужно заранее указывать кол-во страниц
  • для регулярки лучше использовать Parse custom results (Применить регулярку), а не Конструктор результатов
 
Да, в целом пресет рабочий. Но можно сделать несколько улучшений:
  • добавить проверку по коду ответа (Good status) - парсер будет повторять запрос, если получит код ответа, отличный от указанного (200)
  • вместо Use pages лучше использовать Check next page + Page as new query - это позволит не накапливать все страницы в памяти, а обрабатывать их сразу по мере получения, а также не нужно заранее указывать кол-во страниц
  • для регулярки лучше использовать Parse custom results (Применить регулярку), а не Конструктор результатов
Ткните пожалуйста в пример пресета с Check next page + Page as new query
 
Ткните пожалуйста в пример пресета с Check next page + Page as new query
eJx1VFtv2jAU/i8WUlsVEajWh0VdJ1aJXYSAtvAErHKTk+DViT3b4aIo/33HzpVu
e/O5f/7OZ+fEUP2mFwo0GE38dU6kOxOffAWz0qDGMaQY6hNJFZo2aU1mYHz/23K5
QH8IEc24If2cmJMErBR7UIqFgEEWoh0LET4IZ+8pzzBlfTMcbotOhTRMpLouCHYQ
vM3gaBY07lSREZ5pGDKbTDnx8/PMKUuYRX7z4eMtKf7fXmLuWM/g8JiBOrX9jcrg
/YA3AOnSprAH9AyLYrvtEyQJ76wnQiXUjuzJ0YA6pgaR811e9Jy92aQXV6QpeKZ7
WAosiBiH1j1Ba0YTi7UXUgM2Wje6GpijObt4OdVuokWyStlvx1EqMBePioGeKJGg
y4BrYJ2nGvGa9Jydp1nij3xLWUGwXeb6PJb1xI8o18iJRtgTiqDC9xFmQFEj1Lyi
GCkT6ZhzR1eb5mZ9yRgPUULjCIu+V4X/Tpn/1aNortodhUo7KMTQJoViKuKaB7u9
hpmZ9SRCQdOgmlz1xVcgIbUCaRczlq3rDOAZ+R1nTrTIVGA1PuyvndSs7nCplFjh
VIpUEMPRLlUpekKb1q+sDOAT4FTrTxuS4ZsrhUTu7+j65/32+v5ycP356m6z8Whd
sCy7xmgbYZfrSsi2wImBSCMWz6s3WQPP0iW+/Hn6IBLJwRKYZpz37bynVpNjXe3b
Gi1f74sf3AgE0PwFCENw/eO5ZE4qhqhuLdgEV9adWrUMKOerp2k3Qlodo7EzRmrf
80KrCSGR7MFhRw3TyelViQOyNAhE4jV0aQ+OkuOyvR1V4YEqeLHUv2gJAYtY4CXi
Fe/kETvbQCzwI0BmLGHVR9d8innnu/Nz/FfIL70ocywtNgN9yK9GVRF/VPwBlffc
Bw==
 
Назад
Верх