Pular para o conteúdo principal

Métodos de API

ping

Verificação do funcionamento do servidor e da API.

Exemplo de solicitação

{
"password": "pass",
"action": "ping"
}

Exemplo de resposta

{
"success": 1,
"data": "pong"
}

oneRequest

Solicitação única de extração de dados, pode ser utilizado qualquer scraper e modelo. Como resultado, será gerada uma linha de acordo com o formato de resultado definido no modelo, bem como o log completo da operação do scraper.

Exemplo de solicitação

{
"password": "pass",
"action": "oneRequest",
"data": {
"query": "test",
"parser": "SE::Google",
"configPreset": "default",
"preset": "Pages Count use Proxy"
}
}

Descrição dos parâmetros possíveis:

  • parser - qual scraper deve executar a solicitação
  • preset - qual modelo utilizar
  • configPreset - qual configuração de threads utilizar
  • query - a consulta em si
  • rawResults - parâmetro opcional; se definido, em vez da string de resultado resultString, retornará um array results com todos os resultados suportados pelo scraper especificado
  • needData - parâmetro opcional que indica se deve transmitir data e pages na resposta; usado para economizar memória, desativado por padrão
  • doLog - parâmetro opcional que indica se deve retornar o log de operação junto com os resultados; ativado por padrão
  • options - array com opções adicionais aplicadas ao scraper, por exemplo - override - permite sobrescrever valores no modelo

Exemplo de resposta

{
"success": 1,
"data": {
"resultString": "test: 6070000000\n",
"logs": [
[
0,
1614933603,
"Parser SE::Google::0 parse query test"
],
[
0,
1614933603,
"Parse page 1"
],
...
[
0,
1614933604,
"Thread complete work"
]
]
}
}

Descrição das variáveis na resposta:

  • resultString - string de resultado
  • logs - array com os logs de execução da solicitação

Sobrescrita de parâmetros do scraper

Em options, é possível sobrescrever quaisquer parâmetros do scraper utilizado; eles serão aplicados sobre os valores especificados no modelo de configurações.

Exemplo de solicitação:

{
"password": "pass",
"action": "oneRequest",
"data": {
"parser": "SE::Google",
"preset": "default",
"query": "test",
"rawResults": 1,
"doLog": 0,
"options": [
{
"value": 1,
"type": "override",
"id": "pagecount"
},
{
"value": 10,
"type": "override",
"id": "linksperpage"
},
{
"type": "override",
"id": "useproxy",
"value": false
}
]
}
}

Resposta:

{
"success": 1,
"data": {
"logs": [],
"results": [
{
"ads": [],
"success": 1,
"info": {
"success": 1,
"retries": 0,
"stats": {
"success": 1,
"retries": 0,
"proxiesUsed": 0,
"requests": 0,
"queries": 1
}
},
"query": {
"first": "test",
"threadId": "0",
"lvl": 0,
"query": "test",
"queryUid": "0",
"orig": "test",
"prefered_proxy": null
},
"totalcount": "6130000000",
"serp": [
"https://www.test.de/",
"Stiftung Warentest",
"Sichern Sie sich mit der <em>test</em>.de-Flatrate freien Zugriff auf alle <em>Tests</em> und Produktfinder. Mehr erfahren: <em>test</em>.de-Flatrates. <em>Test</em> CO2&nbsp;...",
0,
...
],
"related": [
"test <b>speed</b>",
...
],
"detected_geo": "Germany",
"rich": [
"Featured snippet"
],
"misspell": 0,
"resultsCount": 11
}
]
}
}

bulkRequest

Solicitação em massa de extração de dados, pode ser utilizado qualquer scraper e modelo, além de ser possível especificar em quantas threads realizar a extração. Como resultado, será gerada uma linha de acordo com o formato de resultado definido no modelo, bem como o log completo da operação do scraper para cada thread.

Exemplo de solicitação

{
"password": "pass",
"action": "bulkRequest",
"data": {
"parser": "SE::Google",
"preset": "Pages Count no Proxy",
"configPreset": "default",
"threads": 3,
"rawResults": 1,
"queries": [
"test1",
"test2",
"test3",
"test4",
"test5"
]
}
}

Descrição das variáveis possíveis em data:

  • threads - quantidade de threads para a extração de dados
  • queries - array de consultas. As demais variáveis são totalmente análogas ao oneRequest, com exceção de query

Exemplo de resposta

{
"success": 1,
"data": {
"logs": {
"0": {
"1": [
[
4,
1614935687,
"SE::Google::0",
"test1"
],
...
[
0,
1614935688,
"Thread complete work"
]
]
},
...log por outras threads...
},
"results": [
{
"ads": [],
"success": 1,
"info": {
"success": 1,
"retries": 0,
"stats": {
"success": 1,
"retries": 0,
"proxiesUsed": 0,
"requests": 0,
"queries": 1
}
},
"query": {
"first": "test1",
"threadId": "0",
"lvl": 0,
"query": "test1",
"queryUid": "0",
"orig": "test1",
"prefered_proxy": null
},
"totalcount": "35800000",
"serp": [
"https://www.test1solutions.com/",
"FoamFlex200 | Oil Spill Absorbent | Oil Disaster solution",
"<em>TEST1</em> IS SOLUTION. In addition to the different models&nbsp;...",
0,
...
],
"related": [
"<b>test2</b>",
...
],
"detected_geo": "Germany",
"rich": [
"Featured snippet",
"People also ask"
],
"misspell": 0,
"resultsCount": 12
},
...resultados para as demais consultas...
]
}
}

addTask

Adição de tarefa à fila; todos os parâmetros são análogos aos definidos na interface do Editor de Tarefas.

dica

Para obter rapidamente a configuração completa de uma tarefa, você pode utilizar o Editor de Tarefas, criar a tarefa e obter o JSON para a solicitação de API.

Exemplo de solicitação

{
"password": "pass",
"action": "addTask",
"data": {
"preset": "default",
"configPreset": "100 Threads",
"parsers": [
[
"SE::Bing",
"default",
{
"type": "override",
"id": "pagecount",
"value": 1
},
{
"type": "options",
"id": "parseAll",
"value": true
}
]
],
"resultsFormat": "$p1.serp.format('$link;$anchor\\n')",
"resultsSaveTo": "file",
"resultsFileName": "$datefile.format().csv",
"additionalFormats": [],
"resultsUnique": "string",
"queriesFrom": "text",
"queryFormat": [
"$query"
],
"uniqueQueries": true,
"saveFailedQueries": false,
"iteratorOptions": {
"onAllLevels": false,
"queryBuildersAfterIterator": false,
"queryBuildersOnAllLevels": false
},
"resultsOptions": {
"overwrite": false,
"writeBOM": true
},
"doLog": "db",
"limitLogsCount": "0",
"keepUnique": "No",
"moreOptions": true,
"resultsPrepend": "Link;Âncora\n",
"resultsAppend": "",
"queryBuilders": [],
"resultsBuilders": [],
"configOverrides": [],
"runTaskOnComplete": null,
"useResultsFileAsQueriesFile": false,
"runTaskOnCompleteConfig": "default",
"toolsJS": "",
"prio": 5,
"removeOnComplete": false,
"callURLOnComplete": "",
"queries": [
"test",
"bla-bla"
]
}
}

Exemplo de resposta

A resposta contém o id da tarefa criada.

{
"success": 1,
"data": "697403"
}

Tarefa com consultas de um arquivo

Para que as consultas da tarefa sejam obtidas de um arquivo, é necessário definir "queriesFrom": "file" e o(s) caminho(s) para o(s) arquivo(s) de consultas "queriesFile": ["queries1.txt", "queries2.txt"]. No restante, tudo é idêntico ao exemplo acima.

Exemplo de solicitação

{
"password": "pass",
"action": "addTask",
"data": {
"preset": "default",
"configPreset": "100 Threads",
"parsers": [
[
"SE::Google",
"default"
]
],
"resultsFormat": "$p1.preset",
"resultsSaveTo": "file",
"resultsFileName": "$datefile.format().csv",
"additionalFormats": [],
"resultsUnique": "no",
"queriesFrom": "file",
"queryFormat": [
"$query"
],
"uniqueQueries": false,
"saveFailedQueries": false,
"iteratorOptions": {
"onAllLevels": false,
"queryBuildersAfterIterator": false,
"queryBuildersOnAllLevels": false
},
"resultsOptions": {
"overwrite": false,
"writeBOM": false
},
"doLog": "no",
"limitLogsCount": "0",
"keepUnique": "No",
"moreOptions": false,
"resultsPrepend": "",
"resultsAppend": "",
"queryBuilders": [],
"resultsBuilders": [],
"configOverrides": [],
"runTaskOnComplete": null,
"useResultsFileAsQueriesFile": false,
"runTaskOnCompleteConfig": "default",
"toolsJS": "",
"prio": 5,
"removeOnComplete": false,
"callURLOnComplete": "",
"queriesFile": [
"queries/Text Document.txt"
]
}
}

Exemplo de resposta

{
"success": 1,
"data": "5432"
}

Iniciar uma tarefa salva anteriormente

É possível iniciar um modelo criado previamente através da interface. Neste caso, é necessário apenas especificar as consultas. Também é possível sobrescrever qualquer um dos parâmetros da tarefa; eles serão utilizados sobre os valores do modelo.

Exemplo de solicitação

{
"password": "pass",
"action": "addTask",
"data": {
"queriesFrom": "text",
"queries": [
"google.com",
"yandex.ru"
],
"configPreset": "default",
"preset": "Analyze Domains"
}
}

Exemplo de resposta

{
"success": 1,
"data": "5436"
}

Flag removeOnRestart

Esta flag indica que as tarefas serão removidas ao reiniciar o scraper.

Exemplo de solicitação

{
"password": "pass",
"action": "addTask",
"data": {
"queriesFrom": "text",
"queries": [
"google.com",
"yandex.ru"
],
"configPreset": "default",
"preset": "Analyze Domains",
"removeOnRestart": 1
}
}

Exemplo de resposta

{
"success": 1,
"data": "5437"
}

Flag removeOnComplete

Esta flag indica que as tarefas serão removidas após a conclusão.

Exemplo de solicitação

{
"password": "pass",
"action": "addTask",
"data": {
"queriesFrom": "text",
"queries": [
"google.com",
"yandex.ru"
],
"configPreset": "default",
"preset": "Analyze Domains",
"removeOnComplete": 1
}
}

Exemplo de resposta

{
"success": 1,
"data": "5438"
}

info

Obtenção de informações gerais sobre o estado do A-Parser e obtenção da lista de todos os scrapers disponíveis.

dica

É possível obter o número da versão atual do A-Parser diretamente pelo link: https://a-parser.com/members/versions

Exemplo: {"lastBetaVersion":"1.2.1484","lastAlphaVersion":"1.2.1484","lastVersion":"1.2.1432"}

Exemplo de solicitação

{
"password": "pass",
"action": "info"
}

Exemplo de resposta

{
"success": 1,
"data": {
"tasksInQueue": 0,
"pid": "13968",
"activeProxyCheckerThreads": 0,
"workingTasks": 0,
"activeThreads": 0,
"version": "1.2.1151",
"availableParsers": [
"API::Server::Redis",
"Check::BackLink",
"Check::RosKomNadzor",
"DeepL::Translator",
"GooglePlay::Apps",
"HTML::EmailExtractor",
...
"Util::AntiGate",
"Util::ReCaptcha2",
"Util::YandexRecognize"
]
}
}

getParserPreset

Obtenção das configurações do scraper e modelo especificados.

dica

Com este método, é possível obter a lista completa de parâmetros para uso em outras solicitações de API.

Exemplo de solicitação

{
"password": "pass",
"action": "getParserPreset",
"data": {
"parser": "SE::Google",
"preset": "default"
}
}

Exemplo de resposta

{
"success": 1,
"data": {
"queryformat": "$query",
"parsenotfound": 1,
"reCaptchaRetries": 3,
"pagecount": 5,
"gl": "",
"proxyChecker": "*",
"hl": "en",
"domain": "www.google.com",
"timeout": 60,
"Util_ReCaptcha2_preset": "default",
"useproxy": 1,
"nfpr": 0,
"extraquery": "",
"serptime": "all",
"location": "",
"usesessions": 1,
"filter": 1,
"linksperpage": 100,
"dontTakeSession": 0,
"addHeaders": "",
"serp": "",
"proxyretries": 10,
"device": "desktop",
"requestdelay": 0,
"debug_nonexists_domains": 0,
"proxybannedcleanup": 600,
"formatresult": "$serp.format('$link\\n')",
"reCaptchaPassProxy": 0,
"lr": ""
}
}

getProxies

Solicitação da lista de proxies ativos. Retorna a lista de proxies ativos de todos os testadores de proxy.

Exemplo de solicitação

{
"password": "pass",
"action": "getProxies"
}

Exemplo de resposta

{
"success": 1,
"data": {
"127.0.0.1:23486": [
"socks"
],
"127.0.0.1:23140": [
"socks"
],
"127.0.0.1:21971": [
"http"
]
}
}

O IP:port do proxy será indicado como o nome do array. O primeiro elemento do array é o tipo de proxy, podendo assumir 3 valores - http, socks, socks4. Se a autenticação por login\senha estiver especificada, o segundo e terceiro elementos serão o login e a senha.

Também é possível obter a lista de proxies apenas de testadores de proxy específicos. Para isso, é necessário passar adicionalmente o array checkers.

Exemplo:

{
"password": "pass",
"action": "getProxies",
"data": {
"checkers": [
"Elite proxies",
"free proxies"
]
}
}

getTaskState

Obtenção do estado de uma tarefa pelo seu id.

Exemplo de solicitação

{
"password": "pass",
"action": "getTaskState",
"data": {
"taskUid": "181"
}
}

Exemplo de resposta

{
"success": 1,
"data": {
"status": "completed",
"stats": "<b>Overall stats</b><br>Runtime: 0:00:19<br>HTTP requests: 464<br><br><b>1. HTML::LinkExtractor</b><br>Queries done: 254<br>Successful queries: 252<br>Proxies used: 0 (per query)<br>Retries used: 1.07 (per query)<br>HTTP requests: 1.82 (per query)",
"state": {
"totalFail": 2,
"totalWaitProxyThreads": 0,
"minimized": 0,
"queriesDoneCount": 254,
"avgSpeed": 802,
"activeThreads": 0,
"startTime": 1507281122,
"changeTime": 1507281141,
"queriesCount": 1,
"logExists": 0,
"runTime": 19,
"uniqueResultsCount": 656,
"requests": "464",
"addTime": 1507281120,
"additionalCount": 253,
"queriesDoneCountAtStart": 0,
"lastQuery": "https://www.nytimes.com/ref/membercenter/help/infoservdirectory.html",
"curSpeed": 846,
"started": 1,
"resultsCount": 31079
}
}
}

A resposta fornece o status da tarefa (status) e suas estatísticas (state).

Também é possível obter informações de várias tarefas simultaneamente; para isso, deve-se passar um array de ids.

Exemplo de solicitação

{
"password": "pass",
"action": "getTaskState",
"data": {
"taskUid": [
"22",
"23",
"31"
]
}
}

Neste caso, a resposta conterá um array com os dados de cada tarefa.

Exemplo de resposta

{
"success": 1,
"data": [
{
"status": "completed",
"stats": "<b>Overall stats</b><br>Runtime: 0:00:01<br>HTTP requests: 0<br><br><b>1. SE::Bing</b><br>Queries done: 0<br>Successful queries: 0<br>Proxies used: 0 (per query)<br>Retries used: 0 (per query)<br>HTTP requests: 0 (per query)",
"state": {
"totalFail": 0,
"totalWaitProxyThreads": 0,
"minimized": 0,
"queriesDoneCount": 0,
"avgSpeed": 0,
"activeThreads": 0,
"startTime": 1507023540,
"changeTime": 1507023541,
"queriesCount": 1,
"logExists": 1,
"runTime": 1,
"uniqueResultsCount": 0,
"requests": 0,
"addTime": 1507023443,
"additionalCount": 0,
"queriesDoneCountAtStart": 0,
"lastQuery": "none",
"curSpeed": 0,
"started": 1,
"resultsCount": 0
}
},
...dados das demais tarefas...
]
}

getTaskConf

Obtenção da configuração de uma tarefa pelo seu id.

Exemplo de solicitação

{
"password": "pass",
"action": "getTaskConf",
"data": {
"taskUid": "181"
}
}

Exemplo de resposta

A resposta fornece as configurações da tarefa, incluindo o nome do arquivo resultante.

{
"success": 1,
"data": {
"parsers": [
[
"SE::Bing",
"default",
{
"value": 1,
"type": "override",
"id": "pagecount"
}
]
],
"resultsFileName": "Mar-05_13-12-23.txt",
"runTaskOnComplete": null,
"limitLogsCount": "0",
"resultsPrepend": "",
"origResultsFileName": "$datefile.format().txt",
"queriesFrom": "text",
"runTaskOnCompleteConfig": "default",
"doLog": "db",
"useResultsFileAsQueriesFile": 0,
"additionalFormats": [],
"resultsSaveTo": "file",
"callURLOnComplete": "",
"resultsFormat": "$p1.related.format('$key\\n')",
"queryBuilders": [],
"preset": "default",
"resultsAppend": "",
"uniqueQueries": 0,
"keepUnique": 0,
"prio": "5",
"saveFailedQueries": 0,
"configPreset": "100 Threads",
"queries": [
"test"
],
"toolsJS": "",
"moreOptions": 0,
"resultsBuilders": [],
"resultsUnique": "string",
"iteratorOptions": {
"onAllLevels": 0,
"queryBuildersAfterIterator": 0,
"queryBuildersOnAllLevels": 0
},
"removeOnComplete": 0,
"queryFormat": [
"$query"
],
"configOverrides": [],
"resultsOptions": {
"overwrite": 0,
"writeBOM": 0
}
}
}

getTaskResultsFile

Obtenção do link para download do resultado pelo id da tarefa. Através do link obtido, é possível baixar o arquivo apenas uma vez, sem autenticação (é utilizado um token de uso único).

nota

Funciona apenas com nome de arquivo estático e $datefile.format(). Para transformar um nome de arquivo de resultado dinâmico em estático, pode-se usar a flag do motor de modelos isStaticTemplate().

Exemplo de solicitação

{
"password": "pass",
"action": "getTaskResultsFile",
"data": {
"taskUid": "181"
}
}

Exemplo de resposta

{
"success": 1,
"data": "http://127.0.0.1:9091/downloadResults?fileName=Mar-05_13-12-23.txt&token=wbvwlkes"
}

getTasksList

Obtenção da lista de tarefas ativas. Se passar o parâmetro adicional completed: 1, obteremos a lista de tarefas concluídas.

Exemplo de solicitação

{
"password": "pass",
"action": "getTasksList",
"data": {
"completed": "1"
}
}

Exemplo de resposta

{
"success": 1,
"data": [
"2291",
"2324",
"2331",
"2384",
"2398",
"2434",
"2445",
"3482",
...
]
}

getParserInfo

Exibe a lista de todos os resultados disponíveis que o scraper especificado pode retornar.

Exemplo de solicitação

{
"password" : "pass",
"action" : "getParserInfo",
"data" : {
"parser" : "SE::Google"
}
}

Exemplo de resposta

{
"success": 1,
"data": {
"results": {
"arrays": {
"ads": [
"Ads list",
[
[
"link",
"Link"
],
...
]
],
"related": [
"Related keywords",
[
[
"key",
"Key"
]
]
],
"rich": [
"Rich snippets list",
[
[
"name",
"Name"
]
]
],
"serp": [
"Main serp list",
[
[
"link",
"Link"
],
...
]
],
"pages": [
"Raw data array",
[
[
"data",
"Raw data"
]
]
]
},
"flat": [
[
"query",
"Formatted query"
],
...
]
}
}
}

getAccountsCount

Obtenção da quantidade de contas Yandex ativas.

Exemplo de solicitação

{
"password": "pass",
"action": "getAccountsCount"
}

Exemplo de resposta

{
"success": 1,
"data": {
"SE::Yandex": 18
}
}

deleteTaskResultsFile

Exclusão do arquivo de resultado pelo id da tarefa.

Exemplo de solicitação

{
"password": "pass",
"action": "deleteTaskResultsFile",
"data": {
"taskUid": "181"
}
}

Exemplo de resposta

{
"success": 1
}

changeTaskStatus

Alteração do status da tarefa pelo seu id. Existem apenas 4 estados para os quais uma tarefa pode ser transferida:

  • starting - iniciar tarefa
  • pausing - colocar em pausa
  • stopping - parar tarefa
  • deleting - excluir tarefa

Exemplo de solicitação

{
"password": "pass",
"action": "changeTaskStatus",
"data": {
"taskUid": "181",
"toStatus": "deleting"
}
}

Exemplo de resposta

{
"success": 1
}

changeProxyCheckerState

Alteração do estado do testador de proxy (1 - ativado / 0 - desativado).

Exemplo de solicitação

{
"password": "pass",
"action": "changeProxyCheckerState",
"data": {
"checker": "proxychecker name",
"state": 1
}
}

Exemplo de resposta

{
"success": 1
}

moveTask

Movimentação de uma tarefa na fila pelo seu id. Direções de movimentação possíveis:

  • start - para o início da fila
  • end - para o final da fila
  • up - uma posição acima
  • down - uma posição abaixo

Exemplo de solicitação

{
"password": "pass",
"action": "moveTask",
"data": {
"taskUid": "181",
"direction": "start"
}
}

Exemplo de resposta

{
"success": 1
}

update

Atualiza o arquivo executável do scraper para a última versão disponível. Após o envio do comando, o A-Parser será reiniciado automaticamente. A API retornará uma resposta de sucesso após baixar e atualizar o arquivo executável, o que pode levar de 1 a 3 minutos.

Exemplo de solicitação

{
"password": "pass",
"action": "update"
}

Exemplo de resposta

{
"success": 1
}