Pular para o conteúdo principal

SE::Google::Compromised - Verificação da mensagem This site may be hacked no Google

Visão geral do scraper

O scraper Google Compromised permite verificar a presença do aviso This site may be hacked nos resultados de pesquisa do Google. Com o scraper Google Compromised, você pode verificar suas próprias bases de domínios em busca desse aviso. Mais detalhes sobre este aviso podem ser encontrados na Ajuda da Pesquisa Google.

A funcionalidade do A-Parser permite salvar as configurações de extração de dados para uso futuro (presets), definir agendamentos de extração de dados e muito mais.

A gravação dos resultados é possível no formato e estrutura que você desejar, graças ao poderoso motor de modelos integrado Template Toolkit, que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.

Dados coletados

  • Verificação da presença do aviso This site may be hacked no Google

quais dados o scraper SE::Google::Compromised coleta

Recursos

Casos de uso

  • Verificação de uma lista de domínios quanto à presença do aviso This site may be hacked no Google
  • Monitoramento de seus próprios domínios

Consultas

Como consultas, é necessário indicar a URL do site pesquisado, por exemplo:

http://a-parser.com/  
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/

Substituições de consultas

Você pode usar macros integradas para substituição automática de subconsultas a partir de arquivos; por exemplo, se quisermos verificar sites por uma base de palavras-chave, indicamos algumas consultas principais:

ria.ru
lenta.ru
rbc.ru
yandex.ru

No formato de consulta, indicamos a macro para substituição de palavras adicionais do arquivo Keywords.txt; este método permite verificar a base de sites por uma base de palavras-chave e obter as posições como resultado:

$query {subs:Keywords}

Esta macro criará tantas consultas adicionais quantas estiverem no arquivo para cada consulta de pesquisa original, o que resultará em [quantidade de consultas originais(domínios)] x [quantidade de consultas no arquivo Keywords] = [quantidade total de consultas] como resultado da execução da macro.

Também é possível especificar o protocolo no formato de consulta, para que apenas domínios possam ser usados como consultas:

http://$query 

Este formato prefixará http:// a cada consulta.

Exemplos de saída de resultados

O A-Parser suporta formatação flexível de resultados graças ao motor de modelos integrado Template Toolkit, o que permite exibir resultados em forma livre, bem como estruturada, como CSV ou JSON.

Exportação da lista de verificação de aviso

Formato do resultado:

$query: $compromised\n

Exemplo de resultado, exibindo a URL e a presença do aviso This site may be hacked no Google:

http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0

Da mesma forma que no SE::Google.

Da mesma forma que no SE::Google.

Da mesma forma que no SE::Google.

Concorrência de palavras-chave

Da mesma forma que no SE::Google.

Verificação de indexação de links

Da mesma forma que no SE::Google.

Salvando em formato SQL

Da mesma forma que no SE::Google.

Dump de resultados em JSON

Da mesma forma que no SE::Google.

Processamento de resultados

O A-Parser permite processar resultados diretamente durante a extração de dados; nesta seção, listamos os casos mais populares para o scraper SE::Google::Compromised

Salvando domínios com valor de verificação "1"

Adicione um filtro e, na lista suspensa, selecione a variável do valor de verificação $compromised - Is site compromised. Selecione o tipo: String equal. Em seguida, no campo String, insira o valor desejado 1. Com este filtro, você poderá remover todos os resultados com o valor indesejado.

Exemplo de filtragem
Baixar exemplo

Como importar o exemplo para o A-Parser

eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
dica

Veja também: Filtros de resultados

Da mesma forma que no SE::Google.

Da mesma forma que no SE::Google.

Extração de domínios

Da mesma forma que no SE::Google.

Remoção de tags de âncoras e snippets

Da mesma forma que no SE::Google.

Da mesma forma que no SE::Google.

Configurações possíveis

Suporta todas as configurações do scraper SE::GoogleSE::Google, além de adicionalmente:

Nome do parâmetroValor padrãoDescrição
Pages count1Quantidade de páginas de extração de resultados (de 1 a 10)