Есть миллионные списки доменов. Многие из них нерабочие, проэкспайренные. Нужно весь невалид отфильтровать. Невалидные домены есть двух видов
- которые не открываются вообще.
- которые заредирекчены на страницу регистранта, типа http://kttnet.com или http://ktug.com/
первый вид доменов легко можно прочекать на 200 ОК, как тут http://a-parser.com/threads/772/
а вот вторую группу невалида как можно прочекать?
и нужно сохранить в два файла всё отчеканное - отдельно беды, отдельно гуды. Гуды вроде понятно как сохранить, из того же топика, что и выше я привёл, а как беды сохранять?
Кто сталкивался с таким, помогите, пожалуйста
- которые не открываются вообще.
- которые заредирекчены на страницу регистранта, типа http://kttnet.com или http://ktug.com/
первый вид доменов легко можно прочекать на 200 ОК, как тут http://a-parser.com/threads/772/
а вот вторую группу невалида как можно прочекать?
и нужно сохранить в два файла всё отчеканное - отдельно беды, отдельно гуды. Гуды вроде понятно как сохранить, из того же топика, что и выше я привёл, а как беды сохранять?
Кто сталкивался с таким, помогите, пожалуйста