Пресет Проверка доменов\ссылок на 200 ОК 1.0

Force68 · 18 сен 2013

Кстати, а как почекать домены на 200 ответ?

Forbidden · 18 сен 2013

Сохранять только те домены где есть 200 OK:

Сохранять домен: код ответа:

Force68 · 20 сен 2013

Спасибо!

Forbidden · 20 сен 2013

значительно ускорить обработку можно выбрав в настройках Net::HTTP метод HEAD

BlackAlex · 26 сен 2014

а если мне нужно чтоб отбирало с базы 200 ОК но только с
content-type: application/x-shockwave-flash (остальные content-type не нужны)

можно как-то реализовать в этом чекере? (ну чтоб сохраняло только 200 ОК и только с нужным мне content-type)

Forbidden · 26 сен 2014

BlackAlex сказал(а): ↑

можно как-то реализовать в этом чекере? (ну чтоб сохраняло только 200 ОК и только с нужным мне content-type)
Нажмите, чтобы раскрыть...

Добавляем еще один фильтр по хедерам:

BESHENEI · 7 авг 2015

Поясните пожалуйста, правильно ли я понимаю что чек по определённому content-type и ответ сервера, обозначает что на том или ином домене присутствует или отсутствует тот или иной контент.

Support · 7 авг 2015

Код ответа сервера показывает доступность контента по запрашиваемому адресу. А content-type показывает какие типы контента отдаются по запросу.

BESHENEI · 24 авг 2015

Добрый день - спасибо за ответ.
Возникло ещё пару вопросов:
1. в каком формате подавать на парсинг список доменов(надо или нет http и www или без разницы)???
2.запустила парсинг по настройкам из этого поста, статус в парсере - WORKинг, но прождала более пяти часов, результата всё нет, для тестов использовала всего один домен, как следствие вопрос как долго идёт парсинг в среднем если число страниц на домене от 20000-30000 страниц???
3. имеет ли значение http или https соединение???

мои настройки

Support · 24 авг 2015

Добрый день.

BESHENEI сказал(а): ↑

1. в каком формате подавать на парсинг список доменов(надо или нет http и www или без разницы)???
Нажмите, чтобы раскрыть...

Для парсера Net::HTTP запросы нужно подавать с http

BESHENEI сказал(а): ↑

2.запустила парсинг по настройкам из этого поста, статус в парсере - WORKинг, но прождала более пяти часов, результата всё нет, для тестов использовала всего один домен, как следствие вопрос как долго идёт парсинг в среднем если число страниц на домене от 20000-30000 страниц???
Нажмите, чтобы раскрыть...

В данном примере кол-во страниц на домене не имеет значения. А судя по скринам, вам необходимо проверить прокси (Ожидающих потоков - 1).

BESHENEI сказал(а): ↑

3. имеет ли значение http или https соединение???
Нажмите, чтобы раскрыть...

Не имеет.

BESHENEI · 24 авг 2015

Спасибо за ответ - у меня результат, сменила прокси помогло чек прошёл, но результат неудовлетворительный, файл отчёта нулевой ничего нет, но при просмотре через гугл этот сервер и сам домен содержат пдф-ники, в чём изъян???
Может я не правильно трактую - в моём понимании раз идёт чек сервера на наличие контента, то в отчёте должны быть линки на эти пдф-ки или не так???

Support · 24 авг 2015

В данном примере проверяется код ответа и тип контента выдаваемый по конкретной ссылке. Исходя из ваших скринов, я сомневаюсь, что прямо на главной странице будет пдф. Если же вы хотите проверить все содержимое сайта, т.е. все его страницы, то вам нужно использовать HTML::LinkExtractor вместе с фильтрами, о которых речь шла выше.

BESHENEI · 24 авг 2015

ОК, а результат будет один и тот же или разный если я использую HTML::LinkExtractor и для сравнения оператор парсинга результатов гугла через
site:domen pdf

Support · 24 авг 2015

Если парсить через Гугл, то лучше использовать site:domen filetype:pdf
А насчет результатов - теоретически через линкэкстрактор должны быть лучше, но нужно эксперементировать и сравнивать...

BESHENEI · 24 авг 2015

Support сказал(а): ↑

но нужно эксперементировать и сравнивать...
Нажмите, чтобы раскрыть...

К чему я веду, ответ прост способен ли a-parser дотянутся до того до чего к примеру доступ гугл бота перекрыт, то есть контенту спрятанному от индексации???

Support · 24 авг 2015

Способен.

WarGuss · 2 окт 2015

Подскажите пожалуйста во сколько макс. потоков а-парсером можно проверить базу сайтов на 200 ok ?

Support · 3 окт 2015

Макс. кол-во потоков зависит от характеристик вашей системы и скорости Интернет-канала. Рекомендую потестировать на небольшом кол-ве сайтов с разным кол-вом потоков и выбрать оптимальный для себя.

Cruzcastillo · 5 мар 2017

Вопрос не много не в тему, но подскажите) По какой ошибке определять не работающие домены, к примеру fdbgjgjfsbkjgdbflkgbdsfkgjbsdfglkjbg.com ?

Forbidden · 5 мар 2017

Cruzcastillo сказал(а): ↑

Вопрос не много не в тему, но подскажите) По какой ошибке определять не работающие домены, к примеру fdbgjgjfsbkjgdbflkgbdsfkgjbsdfglkjbg.com ?
Нажмите, чтобы раскрыть...

не существующие домены лучше проверять через парсеры Net::Whois или Net::DNS

Пресет Проверка доменов\ссылок на 200 ОК 1.0

Force68 A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

Force68 A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

BlackAlex A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

WarGuss A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

Cruzcastillo A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise

Поделиться этой страницей

О нас

Быстрая навигация

Twitter

Поддержка

Быстрый поиск

Пресет Проверка доменов\ссылок на 200 ОК 1.0

Force68 A-Parser Enterprise License A-Parser Enterprise

Forbidden Administrator Команда форума A-Parser Enterprise

Force68 A-Parser Enterprise License A-Parser Enterprise

Forbidden Administrator Команда форума A-Parser Enterprise

BlackAlex A-Parser Enterprise License A-Parser Enterprise

Forbidden Administrator Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

WarGuss A-Parser Pro License A-Parser Pro

Support Administrator Команда форума A-Parser Enterprise

Cruzcastillo A-Parser Pro License A-Parser Pro

Forbidden Administrator Команда форума A-Parser Enterprise

Поделиться этой страницей

Служба поддержки

Force68 A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

Force68 A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

BlackAlex A-Parser Enterprise License
A-Parser Enterprise

Forbidden Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

BESHENEI A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

WarGuss A-Parser Pro License
A-Parser Pro

Support Administrator
Команда форума A-Parser Enterprise

Cruzcastillo A-Parser Pro License
A-Parser Pro

Forbidden Administrator
Команда форума A-Parser Enterprise