SE::Yandex::WordStat::ByRegion -

Visão geral do scraper

Wordstat é um serviço do Yandex projetado para avaliar o interesse do usuário em vários tópicos e selecionar palavras-chave para otimização de SEO e publicidade contextual. Além disso, com o Wordstat Yandex, você pode avaliar a sazonalidade e a dependência geográfica das consultas de pesquisa.

O scraper Yandex WordStat by region suporta a multiplicação automática de consultas, garantindo que você obtenha o número máximo de resultados da pesquisa. Além disso, o A-Parser pode navegar automaticamente por consultas relacionadas em uma profundidade especificada.

A funcionalidade do A-Parser permite salvar as configurações de extração de dados para uso futuro (presets), definir cronogramas de extração de dados e muito mais. Você pode usar a multiplicação automática de consultas, substituição de subconsultas a partir de arquivos, combinação de caracteres alfanuméricos e listas para obter a maior quantidade possível de resultados.

A preservação dos resultados é possível na forma e estrutura que você necessita, graças ao poderoso motor de modelos integrado Template Toolkit, que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.

Ir para DEMO Comprar A-Parser Pro ($299)

Contas

Para o funcionamento do scraper SE::Yandex::WordStat::ByRegion são necessárias contas do Yandex. As contas podem ser registradas usando o scraper SE::Yandex::Register ou simplesmente adicionando as contas existentes ao arquivo files/SE-Yandex/accounts.txt no formato suportado.

Ou você pode ativar o registro de contas "on-the-fly".

Dados coletados

Número total de impressões por consulta
Estatísticas de palavras-chave por regiões e cidades:
Região/Cidade
Número de visualizações por mês
Popularidade regional em %

Recursos

Suporte para contorno automático de Smart captcha e a possibilidade de contornar captcha gráfico usando o serviço AntiCaptcha ou qualquer outra API compatível
Escolha do tipo de dispositivo
Possibilidade de escolher o método de autorização
Possibilidade de registrar contas "on-the-fly"
Suporta o trabalho com o formato estendido de contas e sabe responder à pergunta secreta (se a resposta estiver em info). Além disso, utiliza o proxy salvo para autorização (se houver em info).

Casos de uso

Avaliação do volume de tráfego por palavra-chave segmentado por regiões

Consultas

Como consultas, você deve especificar palavras-chave, exatamente como se as estivesse digitando diretamente no formulário de pesquisa do Wordstat, por exemplo:

test

Opções de exibição de resultados

O A-Parser suporta formatação flexível de resultados graças ao motor de modelos integrado Template Toolkit, o que permite exibir resultados em forma livre, bem como estruturada, como CSV ou JSON.

Exibição padrão

Formato do resultado:

$query - Total views: $totalcount\nViews by regions:\n$regions.format('$region $count, $popularity%\n')\nViews by cities:\n$cities.format('$city $count, $popularity%\n')

O resultado exibe o número de impressões por consulta, estatísticas de palavras-chave por regiões e cidades, número de visualizações por mês e popularidade regional:

test - Total views: 872855
Views by regions:
Moscou e região de Moscou 147107, 85%
Centro 194716, 77%
Noroeste 55815, 70%
Sul 31759, 67%
Região do Volga 86006, 66%
...
Views by cities:
Chita 2937, 113%
São Petersburgo 35713, 73%
Belgorod 2737, 58%
Ivanovo 1773, 55%
Kaluga 2196, 64%
Kostroma 1166, 49%

Exibição em tabela CSV

Formato do resultado:

[% FOREACH i IN regions;
    tools.CSVline(query, i.popularity, i.region, i.count);
END %]

Exemplo de resultado:

"teste",88,"Moscou e Região de Moscou",1902795
"teste",96,"Centro",2992864
"teste",95,"Noroeste",926138
"teste",112,Sul,647140
"teste",124,"Região do Volga",1927873
"teste",64,"Oeste",60975
"teste",86,"Leste",427304

Salvamento em formato SQL

Formato do resultado:

[% FOREACH i IN regions;
    "INSERT INTO regions VALUES('" _ query _ "', '";    i.popularity _ "', '"; i.count _ "', '";    i.region _ "')\n";
END %]

Exemplo de resultado:

INSERT INTO regions VALUES('teste', '88', '1902795', 'Moscou e Região de Moscou')
INSERT INTO regions VALUES('teste', '96', '2992864', 'Centro')
INSERT INTO regions VALUES('teste', '95', '926138', 'Noroeste')
INSERT INTO regions VALUES('teste', '112', '647140', 'Sul')
INSERT INTO regions VALUES('teste', '124', '1927873', 'Região do Volga')
INSERT INTO regions VALUES('teste', '64', '60975', 'Oeste')
INSERT INTO regions VALUES('teste', '86', '427304', 'Leste')
INSERT INTO regions VALUES('teste', '80', '89569', 'Sul')
INSERT INTO regions VALUES('teste', '75', '356560', 'Centro')
INSERT INTO regions VALUES('teste', '77', '34894', 'Norte')

Dump de resultados em JSON

Formato geral do resultado:

[% IF notFirst;
  ",\n";
ELSE;
  notFirst = 1;
END;

obj = {};
obj.totalcount = p1.totalcount;
obj.regions = [];

FOREACH item IN p1.regions;
    obj.regions.push({
        popularity = item.popularity
        region = item.region
        count = item.count
    });
END;

obj.json %]

Texto inicial:

Texto final:

Exemplo de resultado:

[
    {
        "regions": [
            {
                "count": "1902795",
                "popularity": 88,
                "region": "Moscou e Região de Moscou"
            },
            {
                "count": "2992864",
                "popularity": 96,
                "region": "Centro"
            },
            {
                "count": "926138",
                "popularity": 95,
                "region": "Noroeste"
            },
            {
                "count": "647140",
                "popularity": 112,
                "region": "Sul"
            },
            {
            
                "count": "34894",
                "popularity": 77,
                "region": "Norte"
            },
        ],
        "totalcount": "10837937"
    }
]

dica

Veja também: Filtros de resultados

Configurações possíveis

nota

Configurações comuns para todos os scrapers

Parâmetro	Valor padrão	Descrição
AntiGate preset	`default`	É necessário configurar previamente o scraper Util::AntiGate - especificar sua chave de acesso e outros parâmetros, e então selecionar o preset criado aqui
AntiGate preset for Login	`default`	Preset AntiGate para login. É necessário configurar previamente o scraper Util::AntiGate com os parâmetros, e então selecionar o preset criado aqui
Type	`All`	Escolha do tipo de dispositivo
Accounts	`Only from "accounts.txt"`	Escolha do método de trabalho com contas: `Always auto register` - sempre registrar automaticamente contas "on-the-fly", requer a seleção de um preset configurado no parâmetro SE::Yandex::Register preset. `Auto register if no more in \"accounts.txt\"` - primeiro são usadas as contas existentes em accounts.txt, e se elas acabarem - é usado o registro automático "on-the-fly", para o qual deve-se selecionar um preset configurado no parâmetro SE::Yandex::Register preset. `Only from \"accounts.txt\"` - usar apenas contas existentes em accounts.txt, e se elas acabarem - aguardar o tempo definido (parâmetro Wait new accounts in "accounts.txt") pelo surgimento de novas
Wait new accounts in "accounts.txt"	`0`	Tempo de espera pelo surgimento de novas contas em accounts.txt
Remove bad accounts	`Always, except wrong login/password`	Remoção automática de contas "ruins": `Always` - sempre remover. `Always, except wrong login/password` - remover sempre, exceto quando o Yandex informar que o login/senha estão incorretos. O fato é que o Yandex pode retornar essa mensagem em caso de banimento de IP para uma conta perfeitamente funcional, portanto, opcionalmente, pode-se manter tais contas para reutilização. `Never` - nunca remover. Independentemente da opção escolhida, em caso de erros de proxy/navegador, as contas não são removidas
SE::Yandex::Register preset	`default`	Escolha do preset de configurações para SE::Yandex::Register
Authorization method	`HTTP`	Método de autorização: `HTTP` - rápido, pouco exigente em recursos. `Chrome` - lento, exigente em recursos, teoricamente pode prolongar a vida das contas
Chrome headless	`☑`	Se a opção estiver ativada, o navegador não será exibido
Use sessions	`☑`	Uso de sessões
Do not reset session if authorization passed	`☑`	Não redefinir a sessão em caso de erros se o scraper já estiver autorizado
Use Wordstat 2	`☐`	Uso do Wordstat 2
Wordstat 2 parse all table data	`☑`	Permite baixar imediatamente todos os 2000 resultados por consulta sem passar pela paginação

Visão geral do scraper​

Contas​

Dados coletados​

Recursos​

Casos de uso​

Consultas​

Opções de exibição de resultados​

Exibição padrão​

Exibição em tabela CSV​

Salvamento em formato SQL​

Dump de resultados em JSON​

Configurações possíveis​

Visão geral do scraper

Contas

Dados coletados

Recursos

Casos de uso

Consultas

Opções de exibição de resultados

Exibição padrão

Exibição em tabela CSV

Salvamento em formato SQL

Dump de resultados em JSON

Configurações possíveis