Pular para o conteúdo principal

SE::Yandex::WordStat::ByRegion -

Yandex WordStat: ByRegion

Visão geral do scraper

Wordstat é um serviço do Yandex projetado para avaliar o interesse do usuário em vários tópicos e selecionar palavras-chave para otimização de SEO e publicidade contextual. Além disso, com o Wordstat Yandex, você pode avaliar a sazonalidade e a dependência geográfica das consultas de pesquisa.

O scraper Yandex WordStat by region suporta a multiplicação automática de consultas, garantindo que você obtenha o número máximo de resultados da pesquisa. Além disso, o A-Parser pode navegar automaticamente por consultas relacionadas em uma profundidade especificada.

A funcionalidade do A-Parser permite salvar as configurações de extração de dados para uso futuro (presets), definir cronogramas de extração de dados e muito mais. Você pode usar a multiplicação automática de consultas, substituição de subconsultas a partir de arquivos, combinação de caracteres alfanuméricos e listas para obter a maior quantidade possível de resultados.

A preservação dos resultados é possível na forma e estrutura que você necessita, graças ao poderoso motor de modelos integrado Template Toolkit, que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.

Contas

Para o funcionamento do scraper SE::Yandex::WordStat::ByRegionSE::Yandex::WordStat::ByRegion são necessárias contas do Yandex. As contas podem ser registradas usando o scraper SE::Yandex::RegisterSE::Yandex::Register ou simplesmente adicionando as contas existentes ao arquivo files/SE-Yandex/accounts.txt no formato suportado.

Ou você pode ativar o registro de contas "on-the-fly".

Dados coletados

  • Número total de impressões por consulta
  • Estatísticas de palavras-chave por regiões e cidades:
  • Região/Cidade
  • Número de visualizações por mês
  • Popularidade regional em %

Recursos

  • Suporte para contorno automático de Smart captcha e a possibilidade de contornar captcha gráfico usando o serviço AntiCaptcha ou qualquer outra API compatível
  • Escolha do tipo de dispositivo
  • Possibilidade de escolher o método de autorização
  • Possibilidade de registrar contas "on-the-fly"
  • Suporta o trabalho com o formato estendido de contas e sabe responder à pergunta secreta (se a resposta estiver em info). Além disso, utiliza o proxy salvo para autorização (se houver em info).

Casos de uso

  • Avaliação do volume de tráfego por palavra-chave segmentado por regiões

Consultas

Como consultas, você deve especificar palavras-chave, exatamente como se as estivesse digitando diretamente no formulário de pesquisa do Wordstat, por exemplo:

test

Opções de exibição de resultados

O A-Parser suporta formatação flexível de resultados graças ao motor de modelos integrado Template Toolkit, o que permite exibir resultados em forma livre, bem como estruturada, como CSV ou JSON.

Exibição padrão

Formato do resultado:

$query - Total views: $totalcount\nViews by regions:\n$regions.format('$region $count, $popularity%\n')\nViews by cities:\n$cities.format('$city $count, $popularity%\n')

O resultado exibe o número de impressões por consulta, estatísticas de palavras-chave por regiões e cidades, número de visualizações por mês e popularidade regional:

test - Total views: 872855
Views by regions:
Moscou e região de Moscou 147107, 85%
Centro 194716, 77%
Noroeste 55815, 70%
Sul 31759, 67%
Região do Volga 86006, 66%
...
Views by cities:
Chita 2937, 113%
São Petersburgo 35713, 73%
Belgorod 2737, 58%
Ivanovo 1773, 55%
Kaluga 2196, 64%
Kostroma 1166, 49%

Exibição em tabela CSV

Formato do resultado:

[% FOREACH i IN regions;
tools.CSVline(query, i.popularity, i.region, i.count);
END %]

Exemplo de resultado:

"teste",88,"Moscou e Região de Moscou",1902795
"teste",96,"Centro",2992864
"teste",95,"Noroeste",926138
"teste",112,Sul,647140
"teste",124,"Região do Volga",1927873
"teste",64,"Oeste",60975
"teste",86,"Leste",427304

Salvamento em formato SQL

Formato do resultado:

[% FOREACH i IN regions;
"INSERT INTO regions VALUES('" _ query _ "', '"; i.popularity _ "', '"; i.count _ "', '"; i.region _ "')\n";
END %]

Exemplo de resultado:

INSERT INTO regions VALUES('teste', '88', '1902795', 'Moscou e Região de Moscou')
INSERT INTO regions VALUES('teste', '96', '2992864', 'Centro')
INSERT INTO regions VALUES('teste', '95', '926138', 'Noroeste')
INSERT INTO regions VALUES('teste', '112', '647140', 'Sul')
INSERT INTO regions VALUES('teste', '124', '1927873', 'Região do Volga')
INSERT INTO regions VALUES('teste', '64', '60975', 'Oeste')
INSERT INTO regions VALUES('teste', '86', '427304', 'Leste')
INSERT INTO regions VALUES('teste', '80', '89569', 'Sul')
INSERT INTO regions VALUES('teste', '75', '356560', 'Centro')
INSERT INTO regions VALUES('teste', '77', '34894', 'Norte')

Dump de resultados em JSON

Formato geral do resultado:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.totalcount = p1.totalcount;
obj.regions = [];

FOREACH item IN p1.regions;
obj.regions.push({
popularity = item.popularity
region = item.region
count = item.count
});
END;

obj.json %]

Texto inicial:

[

Texto final:

]

Exemplo de resultado:

[
{
"regions": [
{
"count": "1902795",
"popularity": 88,
"region": "Moscou e Região de Moscou"
},
{
"count": "2992864",
"popularity": 96,
"region": "Centro"
},
{
"count": "926138",
"popularity": 95,
"region": "Noroeste"
},
{
"count": "647140",
"popularity": 112,
"region": "Sul"
},
{

"count": "34894",
"popularity": 77,
"region": "Norte"
},
],
"totalcount": "10837937"
}
]
dica

Veja também: Filtros de resultados

Configurações possíveis

ParâmetroValor padrãoDescrição
AntiGate presetdefaultÉ necessário configurar previamente o scraper Util::AntiGateUtil::AntiGate - especificar sua chave de acesso e outros parâmetros, e então selecionar o preset criado aqui
AntiGate preset for LogindefaultPreset AntiGate para login. É necessário configurar previamente o scraper Util::AntiGateUtil::AntiGate com os parâmetros, e então selecionar o preset criado aqui
TypeAllEscolha do tipo de dispositivo
AccountsOnly from "accounts.txt"Escolha do método de trabalho com contas: Always auto register - sempre registrar automaticamente contas "on-the-fly", requer a seleção de um preset configurado no parâmetro SE::Yandex::Register preset. Auto register if no more in \"accounts.txt\" - primeiro são usadas as contas existentes em accounts.txt, e se elas acabarem - é usado o registro automático "on-the-fly", para o qual deve-se selecionar um preset configurado no parâmetro SE::Yandex::Register preset. Only from \"accounts.txt\" - usar apenas contas existentes em accounts.txt, e se elas acabarem - aguardar o tempo definido (parâmetro Wait new accounts in "accounts.txt") pelo surgimento de novas
Wait new accounts in "accounts.txt"0Tempo de espera pelo surgimento de novas contas em accounts.txt
Remove bad accountsAlways, except wrong login/passwordRemoção automática de contas "ruins": Always - sempre remover. Always, except wrong login/password - remover sempre, exceto quando o Yandex informar que o login/senha estão incorretos. O fato é que o Yandex pode retornar essa mensagem em caso de banimento de IP para uma conta perfeitamente funcional, portanto, opcionalmente, pode-se manter tais contas para reutilização. Never - nunca remover. Independentemente da opção escolhida, em caso de erros de proxy/navegador, as contas não são removidas
SE::Yandex::Register presetdefaultEscolha do preset de configurações para SE::Yandex::RegisterSE::Yandex::Register
Authorization methodHTTPMétodo de autorização: HTTP - rápido, pouco exigente em recursos. Chrome - lento, exigente em recursos, teoricamente pode prolongar a vida das contas
Chrome headlessSe a opção estiver ativada, o navegador não será exibido
Use sessionsUso de sessões
Do not reset session if authorization passedNão redefinir a sessão em caso de erros se o scraper já estiver autorizado
Use Wordstat 2Uso do Wordstat 2
Wordstat 2 parse all table dataPermite baixar imediatamente todos os 2000 resultados por consulta sem passar pela paginação