SE::Yandex::WordStat::ByRegion -

Visão geral do scraper
Wordstat é um serviço do Yandex projetado para avaliar o interesse do usuário em vários tópicos e selecionar palavras-chave para otimização de SEO e publicidade contextual. Além disso, com o Wordstat Yandex, você pode avaliar a sazonalidade e a dependência geográfica das consultas de pesquisa.
O scraper Yandex WordStat by region suporta a multiplicação automática de consultas, garantindo que você obtenha o número máximo de resultados da pesquisa. Além disso, o A-Parser pode navegar automaticamente por consultas relacionadas em uma profundidade especificada.
A funcionalidade do A-Parser permite salvar as configurações de extração de dados para uso futuro (presets), definir cronogramas de extração de dados e muito mais. Você pode usar a multiplicação automática de consultas, substituição de subconsultas a partir de arquivos, combinação de caracteres alfanuméricos e listas para obter a maior quantidade possível de resultados.
A preservação dos resultados é possível na forma e estrutura que você necessita, graças ao poderoso motor de modelos integrado Template Toolkit, que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.
Contas
Para o funcionamento do scraper
SE::Yandex::WordStat::ByRegion são necessárias contas do Yandex. As contas podem ser registradas usando o scraper
SE::Yandex::Register ou simplesmente adicionando as contas existentes ao arquivo files/SE-Yandex/accounts.txt no formato suportado.
Ou você pode ativar o registro de contas "on-the-fly".
Dados coletados
- Número total de impressões por consulta
- Estatísticas de palavras-chave por regiões e cidades:
- Região/Cidade
- Número de visualizações por mês
- Popularidade regional em %
Recursos
- Suporte para contorno automático de Smart captcha e a possibilidade de contornar captcha gráfico usando o serviço AntiCaptcha ou qualquer outra API compatível
- Escolha do tipo de dispositivo
- Possibilidade de escolher o método de autorização
- Possibilidade de registrar contas "on-the-fly"
- Suporta o trabalho com o formato estendido de contas e sabe responder à pergunta secreta (se a resposta estiver em
info). Além disso, utiliza o proxy salvo para autorização (se houver eminfo).
Casos de uso
- Avaliação do volume de tráfego por palavra-chave segmentado por regiões
Consultas
Como consultas, você deve especificar palavras-chave, exatamente como se as estivesse digitando diretamente no formulário de pesquisa do Wordstat, por exemplo:
test
Opções de exibição de resultados
O A-Parser suporta formatação flexível de resultados graças ao motor de modelos integrado Template Toolkit, o que permite exibir resultados em forma livre, bem como estruturada, como CSV ou JSON.
Exibição padrão
Formato do resultado:
$query - Total views: $totalcount\nViews by regions:\n$regions.format('$region $count, $popularity%\n')\nViews by cities:\n$cities.format('$city $count, $popularity%\n')
O resultado exibe o número de impressões por consulta, estatísticas de palavras-chave por regiões e cidades, número de visualizações por mês e popularidade regional:
test - Total views: 872855
Views by regions:
Moscou e região de Moscou 147107, 85%
Centro 194716, 77%
Noroeste 55815, 70%
Sul 31759, 67%
Região do Volga 86006, 66%
...
Views by cities:
Chita 2937, 113%
São Petersburgo 35713, 73%
Belgorod 2737, 58%
Ivanovo 1773, 55%
Kaluga 2196, 64%
Kostroma 1166, 49%
Exibição em tabela CSV
Formato do resultado:
[% FOREACH i IN regions;
tools.CSVline(query, i.popularity, i.region, i.count);
END %]
Exemplo de resultado:
"teste",88,"Moscou e Região de Moscou",1902795
"teste",96,"Centro",2992864
"teste",95,"Noroeste",926138
"teste",112,Sul,647140
"teste",124,"Região do Volga",1927873
"teste",64,"Oeste",60975
"teste",86,"Leste",427304
Salvamento em formato SQL
Formato do resultado:
[% FOREACH i IN regions;
"INSERT INTO regions VALUES('" _ query _ "', '"; i.popularity _ "', '"; i.count _ "', '"; i.region _ "')\n";
END %]
Exemplo de resultado:
INSERT INTO regions VALUES('teste', '88', '1902795', 'Moscou e Região de Moscou')
INSERT INTO regions VALUES('teste', '96', '2992864', 'Centro')
INSERT INTO regions VALUES('teste', '95', '926138', 'Noroeste')
INSERT INTO regions VALUES('teste', '112', '647140', 'Sul')
INSERT INTO regions VALUES('teste', '124', '1927873', 'Região do Volga')
INSERT INTO regions VALUES('teste', '64', '60975', 'Oeste')
INSERT INTO regions VALUES('teste', '86', '427304', 'Leste')
INSERT INTO regions VALUES('teste', '80', '89569', 'Sul')
INSERT INTO regions VALUES('teste', '75', '356560', 'Centro')
INSERT INTO regions VALUES('teste', '77', '34894', 'Norte')
Dump de resultados em JSON
Formato geral do resultado:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.totalcount = p1.totalcount;
obj.regions = [];
FOREACH item IN p1.regions;
obj.regions.push({
popularity = item.popularity
region = item.region
count = item.count
});
END;
obj.json %]
Texto inicial:
[
Texto final:
]
Exemplo de resultado:
[
{
"regions": [
{
"count": "1902795",
"popularity": 88,
"region": "Moscou e Região de Moscou"
},
{
"count": "2992864",
"popularity": 96,
"region": "Centro"
},
{
"count": "926138",
"popularity": 95,
"region": "Noroeste"
},
{
"count": "647140",
"popularity": 112,
"region": "Sul"
},
{
"count": "34894",
"popularity": 77,
"region": "Norte"
},
],
"totalcount": "10837937"
}
]
Veja também: Filtros de resultados
Configurações possíveis
| Parâmetro | Valor padrão | Descrição |
|---|---|---|
| AntiGate preset | default | É necessário configurar previamente o scraper Util::AntiGate - especificar sua chave de acesso e outros parâmetros, e então selecionar o preset criado aqui |
| AntiGate preset for Login | default | Preset AntiGate para login. É necessário configurar previamente o scraper Util::AntiGate com os parâmetros, e então selecionar o preset criado aqui |
| Type | All | Escolha do tipo de dispositivo |
| Accounts | Only from "accounts.txt" | Escolha do método de trabalho com contas: Always auto register - sempre registrar automaticamente contas "on-the-fly", requer a seleção de um preset configurado no parâmetro SE::Yandex::Register preset. Auto register if no more in \"accounts.txt\" - primeiro são usadas as contas existentes em accounts.txt, e se elas acabarem - é usado o registro automático "on-the-fly", para o qual deve-se selecionar um preset configurado no parâmetro SE::Yandex::Register preset. Only from \"accounts.txt\" - usar apenas contas existentes em accounts.txt, e se elas acabarem - aguardar o tempo definido (parâmetro Wait new accounts in "accounts.txt") pelo surgimento de novas |
| Wait new accounts in "accounts.txt" | 0 | Tempo de espera pelo surgimento de novas contas em accounts.txt |
| Remove bad accounts | Always, except wrong login/password | Remoção automática de contas "ruins": Always - sempre remover. Always, except wrong login/password - remover sempre, exceto quando o Yandex informar que o login/senha estão incorretos. O fato é que o Yandex pode retornar essa mensagem em caso de banimento de IP para uma conta perfeitamente funcional, portanto, opcionalmente, pode-se manter tais contas para reutilização. Never - nunca remover. Independentemente da opção escolhida, em caso de erros de proxy/navegador, as contas não são removidas |
| SE::Yandex::Register preset | default | Escolha do preset de configurações para SE::Yandex::Register |
| Authorization method | HTTP | Método de autorização: HTTP - rápido, pouco exigente em recursos. Chrome - lento, exigente em recursos, teoricamente pode prolongar a vida das contas |
| Chrome headless | ☑ | Se a opção estiver ativada, o navegador não será exibido |
| Use sessions | ☑ | Uso de sessões |
| Do not reset session if authorization passed | ☑ | Não redefinir a sessão em caso de erros se o scraper já estiver autorizado |
| Use Wordstat 2 | ☐ | Uso do Wordstat 2 |
| Wordstat 2 parse all table data | ☑ | Permite baixar imediatamente todos os 2000 resultados por consulta sem passar pela paginação |
