SE::Google::Compromised - Verificação da mensagem This site may be hacked no Google
Visão geral do scraper
O scraper Google Compromised permite verificar a presença do aviso This site may be hacked nos resultados de pesquisa do Google. Com o scraper Google Compromised, você pode verificar suas próprias bases de domínios em busca desse aviso. Mais detalhes sobre este aviso podem ser encontrados na Ajuda da Pesquisa Google.
A funcionalidade do A-Parser permite salvar as configurações de extração de dados para uso futuro (presets), definir agendamentos de extração de dados e muito mais.
A gravação dos resultados é possível no formato e estrutura que você desejar, graças ao poderoso motor de modelos integrado Template Toolkit, que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.
Dados coletados
- Verificação da presença do aviso This site may be hacked no Google

Recursos
- Suporta todos os recursos do scraper
SE::Google.
Casos de uso
- Verificação de uma lista de domínios quanto à presença do aviso This site may be hacked no Google
- Monitoramento de seus próprios domínios
Consultas
Como consultas, é necessário indicar a URL do site pesquisado, por exemplo:
http://a-parser.com/
http://www.yandex.ru/
http://google.com/
http://russbehnke.com/
http://www.bmlaroca.cat/
http://vk.com/
http://facebook.com/
http://youtube.com/
Substituições de consultas
Você pode usar macros integradas para substituição automática de subconsultas a partir de arquivos; por exemplo, se quisermos verificar sites por uma base de palavras-chave, indicamos algumas consultas principais:
ria.ru
lenta.ru
rbc.ru
yandex.ru
No formato de consulta, indicamos a macro para substituição de palavras adicionais do arquivo Keywords.txt; este método permite verificar a base de sites por uma base de palavras-chave e obter as posições como resultado:
$query {subs:Keywords}
Esta macro criará tantas consultas adicionais quantas estiverem no arquivo para cada consulta de pesquisa original, o que resultará em [quantidade de consultas originais(domínios)] x [quantidade de consultas no arquivo Keywords] = [quantidade total de consultas] como resultado da execução da macro.
Também é possível especificar o protocolo no formato de consulta, para que apenas domínios possam ser usados como consultas:
http://$query
Este formato prefixará http:// a cada consulta.
Exemplos de saída de resultados
O A-Parser suporta formatação flexível de resultados graças ao motor de modelos integrado Template Toolkit, o que permite exibir resultados em forma livre, bem como estruturada, como CSV ou JSON.
Exportação da lista de verificação de aviso
Formato do resultado:
$query: $compromised\n
Exemplo de resultado, exibindo a URL e a presença do aviso This site may be hacked no Google:
http://a-parser.com/: 0
http://www.bmlaroca.cat/: 1
http://russbehnke.com/: 0
http://www.yandex.ru/: 0
http://google.com/: 0
Links + âncoras + snippets com exibição de posição
Da mesma forma que no SE::Google.
Exibição de links, âncoras e snippets em tabela CSV
Da mesma forma que no SE::Google.
Salvando palavras-chave relacionadas
Da mesma forma que no SE::Google.
Concorrência de palavras-chave
Da mesma forma que no SE::Google.
Verificação de indexação de links
Da mesma forma que no SE::Google.
Salvando em formato SQL
Da mesma forma que no SE::Google.
Dump de resultados em JSON
Da mesma forma que no SE::Google.
Processamento de resultados
O A-Parser permite processar resultados diretamente durante a extração de dados; nesta seção, listamos os casos mais populares para o scraper SE::Google::Compromised
Salvando domínios com valor de verificação "1"
Adicione um filtro e, na lista suspensa, selecione a variável do valor de verificação $compromised - Is site compromised. Selecione o tipo: String equal. Em seguida, no campo String, insira o valor desejado 1. Com este filtro, você poderá remover todos os resultados com o valor indesejado.

Baixar exemplo
Como importar o exemplo para o A-Parser
eJx1VE1z2jAQ/SseTQ7tDDFw6MU3woROOzSkITkBB2GtiYosCUnmYzz8965kYxta
btZ+vH37dtclcdRu7asBC86SZFESHb5JQubPSfJdqY2AJBmrXBuVcwsseowmXDgw
ERxprgWQHtHUWDA+f3EvDaMYZLQQjvRK4k4asITagzGceQjO8J0pk1OHBEIY2VNR
+LCHXQHmlEQPaYu3XEpyvo+EYceTAWc42A7ScDAYdNOy0AkG1DUTkl5RrvzvVTDs
Ciq6YPittONK4sOCtOS8Wl2g7CT04tnrYVyL2jjndA/vqiIArRmFhReah54ZdeC9
cSXKl6+xO3oEyhj3NamoKnjV26ofku8COakw1uuGAkywITQ5CABBzAu7RS0uQYgi
5P6uckiSUWGhRyxSnVAkwm49HKWhTplZ0ADtJVFyJMQU9iDasID/VHDBcEVGGSb9
qBP/HzL7B+PctNcthRM/GOTQoITX0+xXm8XUVG2wc7bGvgXPucO3HatC+sEM0LgF
0I1mL16zXBloytTIdXU8Ew3Sr1c7spFuTVdtXI3l2pgqmfHNrF7ZS2Qh3/EWZ9If
jQDflyyEwLFYeGvXY2TrMfhHS/A2eRxK+NYvR0ecUsL+nFdUteG4ft88wRyV7Fat
IVMqxMfbtOsh7Urh49M5nfT79LG6/hgvpx9FS1nbD4dDfKKSwTE2RdexCT+H23BT
WLuGT7mtPFcw61xQo1Iap9T1iafmYKNwaVG486r5/TR/sfLuTygpz7gWf+xrleE1
9PFow2HYcMnD81/p/MfQ
Veja também: Filtros de resultados
Desduplicação de links
Da mesma forma que no SE::Google.
Desduplicação de links por domínio
Da mesma forma que no SE::Google.
Extração de domínios
Da mesma forma que no SE::Google.
Remoção de tags de âncoras e snippets
Da mesma forma que no SE::Google.
Filtragem de links por ocorrência
Da mesma forma que no SE::Google.
Configurações possíveis
Suporta todas as configurações do scraper
SE::Google, além de adicionalmente:
| Nome do parâmetro | Valor padrão | Descrição |
|---|---|---|
| Pages count | 1 | Quantidade de páginas de extração de resultados (de 1 a 10) |