Фильтрация результатов в зависимости от контента

Пресет Проверка сайтов на наличие определенных фраз и запись в файлы в зависимости от результата проверки 1.0

Доступно владельцам лицензии
  • Автор темы Автор темы Gerero
  • Дата начала Дата начала

Gerero

A-Parser Enterprise License
A-Parser Enterprise
Есть список сайтов в формате: site1.ru|email1|pass1|pass2|pass3

Нужно проверить на каждом из них (первый столбец) наличие одной из четырех фраз: фраза1, фраза2, фраза3, фраза4.

Если этих фраз нет то спарсить тайтл, который находится между тегами <title> и </title>.

Результаты записать в соответсвующие файлы:
Нашли фразу1 - пишем в файл фраза1.txt в формате: site1.ru|email1|pass1|pass2|pass3
Нашли фразу2 - пишем в файл фраза2.txt в формате: site1.ru|email1|pass1|pass2|pass3
.
.
Ничего не нашли из наших фраз, парсим тайтл - пишем в файл title.txt в формате: site1.ru|email1|pass1|pass2|pass3|title
 
HXwkA.png

Код:
eyJwcmVzZXQiOiJodHRwOi8vYS1wYXJzZXIuY29tL3RocmVhZHMvMTc4My8iLCJ2
YWx1ZSI6eyJwcmVzZXQiOiJodHRwOi8vYS1wYXJzZXIuY29tL3RocmVhZHMvMTc4
My8iLCJwYXJzZXJzIjpbWyJOZXQ6OkhUVFAiLCJkZWZhdWx0Iix7InR5cGUiOiJv
dmVycmlkZSIsImlkIjoicXVlcnlmb3JtYXQiLCJ2YWx1ZSI6Imh0dHA6Ly8kcXVl
cnkuc2l0ZSJ9LHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEi
LCJyZWdleCI6Ijx0aXRsZT4oLis/KTxcXC90aXRsZT4iLCJyZWdleFR5cGUiOiJz
IiwicmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1bHRzIjpb
InRpdGxlIl19LHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEi
LCJyZWdleCI6IihcdTA0NDRcdTA0NDBcdTA0MzBcdTA0MzdcdTA0MzAxKSIsInJl
Z2V4VHlwZSI6ImlzIiwicmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIi
LCJyZXN1bHRzIjpbInN0cmluZzEiXX0seyJ0eXBlIjoiY3VzdG9tUmVzdWx0Iiwi
cmVzdWx0IjoiZGF0YSIsInJlZ2V4IjoiKFx1MDQ0NFx1MDQ0MFx1MDQzMFx1MDQz
N1x1MDQzMDIpIiwicmVnZXhUeXBlIjoiaXMiLCJyZXN1bHRUeXBlIjoiZmxhdCIs
ImFycmF5TmFtZSI6IiIsInJlc3VsdHMiOlsic3RyaW5nMiJdfSx7InR5cGUiOiJj
dXN0b21SZXN1bHQiLCJyZXN1bHQiOiJkYXRhIiwicmVnZXgiOiIoXHUwNDQ0XHUw
NDQwXHUwNDMwXHUwNDM3XHUwNDMwMykiLCJyZWdleFR5cGUiOiJpcyIsInJlc3Vs
dFR5cGUiOiJmbGF0IiwiYXJyYXlOYW1lIjoiIiwicmVzdWx0cyI6WyJzdHJpbmcz
Il19LHsidHlwZSI6ImN1c3RvbVJlc3VsdCIsInJlc3VsdCI6ImRhdGEiLCJyZWdl
eCI6IihcdTA0NDRcdTA0NDBcdTA0MzBcdTA0MzdcdTA0MzA0KSIsInJlZ2V4VHlw
ZSI6ImlzIiwicmVzdWx0VHlwZSI6ImZsYXQiLCJhcnJheU5hbWUiOiIiLCJyZXN1
bHRzIjpbInN0cmluZzQiXX0seyJ0eXBlIjoib3ZlcnJpZGUiLCJpZCI6ImZvcm1h
dHJlc3VsdCIsInZhbHVlIjoiWyUgSUYgc3RyaW5nMSA9PSAnbm9uZScgQU5EIHN0
cmluZzIgPT0gJ25vbmUnIEFORCBzdHJpbmczID09ICdub25lJyBBTkQgc3RyaW5n
NCA9PSAnbm9uZSc7XG5xdWVyeS5zaXRlIF8gJ3wnIF8gcXVlcnkuZW1haWwgXyAn
fCcgXyBxdWVyeS5wYXNzMSBfICd8JyBfIHF1ZXJ5LnBhc3MyIF8gJ3wnIF8gcXVl
cnkucGFzczMgXyAnfCcgXyB0aXRsZSBfIFwiXFxuXCI7XG5FTFNFO1xucXVlcnku
c2l0ZSBfICd8JyBfIHF1ZXJ5LmVtYWlsIF8gJ3wnIF8gcXVlcnkucGFzczEgXyAn
fCcgXyBxdWVyeS5wYXNzMiBfICd8JyBfIHF1ZXJ5LnBhc3MzIF8gXCJcXG5cIjtc
bkVORCAlXSJ9XV0sInJlc3VsdHNGb3JtYXQiOiIkcDEucHJlc2V0IiwicmVzdWx0
c1NhdmVUbyI6ImZpbGUiLCJyZXN1bHRzRmlsZU5hbWUiOiJbJSBJRiBwMS5zdHJp
bmcxID09ICdub25lJyBBTkQgcDEuc3RyaW5nMiA9PSAnbm9uZScgQU5EIHAxLnN0
cmluZzMgPT0gJ25vbmUnIEFORCBwMS5zdHJpbmc0ID09ICdub25lJztcbid0aXRs
ZS50eHQnO1xuRU5EICVdIiwiYWRkaXRpb25hbEZvcm1hdHMiOltbIlslIElGIHAx
LnN0cmluZzEgIT0gJ25vbmUnO1xucDEuc3RyaW5nMSBfICcudHh0JztcbkVORCAl
XSIsIiRwMS5wcmVzZXQiXSxbIlslIElGIHAxLnN0cmluZzIgIT0gJ25vbmUnO1xu
cDEuc3RyaW5nMiBfICcudHh0JztcbkVORCAlXSIsIiRwMS5wcmVzZXQiXSxbIlsl
IElGIHAxLnN0cmluZzMgIT0gJ25vbmUnO1xucDEuc3RyaW5nMyBfICcudHh0Jztc
bkVORCAlXSIsIiRwMS5wcmVzZXQiXSxbIlslIElGIHAxLnN0cmluZzQgIT0gJ25v
bmUnO1xucDEuc3RyaW5nNCBfICcudHh0JztcbkVORCAlXSIsIiRwMS5wcmVzZXQi
XV0sInJlc3VsdHNVbmlxdWUiOiJubyIsInF1ZXJ5Rm9ybWF0IjpbIiRxdWVyeSJd
LCJ1bmlxdWVRdWVyaWVzIjpmYWxzZSwic2F2ZUZhaWxlZFF1ZXJpZXMiOmZhbHNl
LCJpdGVyYXRvck9wdGlvbnMiOnsib25BbGxMZXZlbHMiOmZhbHNlLCJxdWVyeUJ1
aWxkZXJzQWZ0ZXJJdGVyYXRvciI6ZmFsc2V9LCJyZXN1bHRzT3B0aW9ucyI6eyJv
dmVyd3JpdGUiOmZhbHNlfSwiZG9Mb2ciOiJubyIsImtlZXBVbmlxdWUiOiJObyIs
Im1vcmVPcHRpb25zIjpmYWxzZSwicmVzdWx0c1ByZXBlbmQiOiIiLCJyZXN1bHRz
QXBwZW5kIjoiIiwicXVlcnlCdWlsZGVycyI6W3sic291cmNlIjoicXVlcnkiLCJ0
eXBlIjoic3RyaW5nU3BsaXQiLCJzZXBhcmF0b3IiOiJ8IiwidG8iOlsic2l0ZSIs
ImVtYWlsIiwicGFzczEiLCJwYXNzMiIsInBhc3MzIl19XSwicmVzdWx0c0J1aWxk
ZXJzIjpbXSwiY29uZmlnT3ZlcnJpZGVzIjpbXX19
*Вместо фраза1, фраза2... пишем нужные фразы и обязательно в скобках.
 
Подскажите, как сделать проект на подобе этого, но проще. Есть список сайтов, нужно перейти на каждый сайт и проверить наличие фразы. Если фраза найдена, то записываем сайт в результирующий файл.
 
Последнее редактирование:
Нужно использовать Net::HTTP и фильтром проверять наличие нужной фразы в $data. В файл выводить $query.
В Каталоге примеров можно найти примеры использования фильтров.
 
Последнее редактирование:
Назад
Верх