При парсинге отдается 200, но контент не валидный - т.е. прокси вернул шляпу или страница яндекса не догрузилась. В таких случаях парсинг должен продолжаться т.к возникла ошибка, см ниже в логе парсер сообщил об ошибке "Error, results count not found".
1. Должна быть проверка, что html получен весь, т.е </html> должен быть.
1.1. если нет </html> то продолжаем парсинг.
2. Должна быть проверка, что это контент яндекса, а не прокси вернул что-то левое.
2.1. если в п.2 контент яндекса и возникает ошибка - то парсинг должен прекращаться, т.е. яндекс возможно поменял верстку и нечего его долбить.
2.2. если в п.2 контент не яндекса, то продолжаем парсинг.


1. Должна быть проверка, что html получен весь, т.е </html> должен быть.
1.1. если нет </html> то продолжаем парсинг.
2. Должна быть проверка, что это контент яндекса, а не прокси вернул что-то левое.
2.1. если в п.2 контент яндекса и возникает ошибка - то парсинг должен прекращаться, т.е. яндекс возможно поменял верстку и нечего его долбить.
2.2. если в п.2 контент не яндекса, то продолжаем парсинг.

Вложения
Последнее редактирование: