Przejdź do treści głównej

Metody API

ping

Sprawdzanie działania serwera i API.

Przykład zapytania

{
"password": "pass",
"action": "ping"
}

Przykład odpowiedzi

{
"success": 1,
"data": "pong"
}

oneRequest

Pojedyncze zapytanie o scrapowanie, może być użyty dowolny scraper i preset. W rezultacie zostanie wygenerowany ciąg znaków zgodnie z formatem wyniku określonym w presecie, a także pełny log pracy scrapera.

Przykład zapytania

{
"password": "pass",
"action": "oneRequest",
"data": {
"query": "test",
"parser": "SE::Google",
"configPreset": "default",
"preset": "Pages Count use Proxy"
}
}

Opis możliwych parametrów:

  • parser - jakim scraperem wykonać zapytanie
  • preset - jakiego użyć presetu
  • configPreset - jakiego configu wątków użyć
  • query - samo zapytanie
  • rawResults - opcjonalny parametr, jeśli jest ustawiony, to zamiast ciągu wynikowego resultString zwróci tablicę results ze wszystkimi wynikami, które obsługuje dany scraper
  • needData - opcjonalny parametr wskazujący, czy przekazywać w odpowiedzi data i pages, używany do oszczędzania pamięci, domyślnie wyłączony
  • doLog - opcjonalny parametr wskazujący, czy zwracać log pracy wraz z wynikami, domyślnie włączony
  • options - tablica z dodatkowymi opcjami stosowanymi do scrapera, na przykład - override - pozwala nadpisywać wartości w presecie

Przykład odpowiedzi

{
"success": 1,
"data": {
"resultString": "test: 6070000000\n",
"logs": [
[
0,
1614933603,
"Parser SE::Google::0 parse query test"
],
[
0,
1614933603,
"Parse page 1"
],
...
[
0,
1614933604,
"Thread complete work"
]
]
}
}

Opis zmiennych w odpowiedzi:

  • resultString - ciąg wynikowy
  • logs - tablica z logami wykonania zapytania

Nadpisywanie parametrów scrapera

W options można nadpisać dowolne parametry używanego scrapera, zostaną one użyte zamiast wartości określonych w presecie ustawień.

Przykład zapytania:

{
"password": "pass",
"action": "oneRequest",
"data": {
"parser": "SE::Google",
"preset": "default",
"query": "test",
"rawResults": 1,
"doLog": 0,
"options": [
{
"value": 1,
"type": "override",
"id": "pagecount"
},
{
"value": 10,
"type": "override",
"id": "linksperpage"
},
{
"type": "override",
"id": "useproxy",
"value": false
}
]
}
}

Odpowiedź:

{
"success": 1,
"data": {
"logs": [],
"results": [
{
"ads": [],
"success": 1,
"info": {
"success": 1,
"retries": 0,
"stats": {
"success": 1,
"retries": 0,
"proxiesUsed": 0,
"requests": 0,
"queries": 1
}
},
"query": {
"first": "test",
"threadId": "0",
"lvl": 0,
"query": "test",
"queryUid": "0",
"orig": "test",
"prefered_proxy": null
},
"totalcount": "6130000000",
"serp": [
"https://www.test.de/",
"Stiftung Warentest",
"Sichern Sie sich mit der <em>test</em>.de-Flatrate freien Zugriff auf alle <em>Tests</em> und Produktfinder. Mehr erfahren: <em>test</em>.de-Flatrates. <em>Test</em> CO2&nbsp;...",
0,
...
],
"related": [
"test <b>speed</b>",
...
],
"detected_geo": "Germany",
"rich": [
"Featured snippet"
],
"misspell": 0,
"resultsCount": 11
}
]
}
}

bulkRequest

Masowe zapytanie o scrapowanie, może być użyty dowolny scraper i preset, a także można wskazać, w ilu wątkach przeprowadzać scrapowanie. W rezultacie zostanie wygenerowany ciąg znaków zgodnie z formatem wyniku określonym w presecie, a także pełny log pracy scrapera dla każdego wątku.

Przykład zapytania

{
"password": "pass",
"action": "bulkRequest",
"data": {
"parser": "SE::Google",
"preset": "Pages Count no Proxy",
"configPreset": "default",
"threads": 3,
"rawResults": 1,
"queries": [
"test1",
"test2",
"test3",
"test4",
"test5"
]
}
}

Opis możliwych zmiennych w data:

  • threads - liczba wątków do scrapowania
  • queries - tablica zapytań. Pozostałe zmienne są całkowicie analogiczne do oneRequest, z wyjątkiem query

Przykład odpowiedzi

{
"success": 1,
"data": {
"logs": {
"0": {
"1": [
[
4,
1614935687,
"SE::Google::0",
"test1"
],
...
[
0,
1614935688,
"Thread complete work"
]
]
},
...log po pozostałych wątkach...
},
"results": [
{
"ads": [],
"success": 1,
"info": {
"success": 1,
"retries": 0,
"stats": {
"success": 1,
"retries": 0,
"proxiesUsed": 0,
"requests": 0,
"queries": 1
}
},
"query": {
"first": "test1",
"threadId": "0",
"lvl": 0,
"query": "test1",
"queryUid": "0",
"orig": "test1",
"prefered_proxy": null
},
"totalcount": "35800000",
"serp": [
"https://www.test1solutions.com/",
"FoamFlex200 | Oil Spill Absorbent | Oil Disaster solution",
"<em>TEST1</em> IS SOLUTION. In addition to the different models&nbsp;...",
0,
...
],
"related": [
"<b>test2</b>",
...
],
"detected_geo": "Germany",
"rich": [
"Featured snippet",
"People also ask"
],
"misspell": 0,
"resultsCount": 12
},
...wyniki dla pozostałych zapytań...
]
}
}

addTask

Dodawanie zadania do kolejki, wszystkie parametry są analogiczne do tych ustawianych w interfejsie Edytora zadań

wskazówka

Aby szybko uzyskać pełną konfigurację zadania, można skorzystać z Edytora zadań, przygotować zadanie i uzyskać JSON dla zapytania API

Przykład zapytania

{
"password": "pass",
"action": "addTask",
"data": {
"preset": "default",
"configPreset": "100 Threads",
"parsers": [
[
"SE::Bing",
"default",
{
"type": "override",
"id": "pagecount",
"value": 1
},
{
"type": "options",
"id": "parseAll",
"value": true
}
]
],
"resultsFormat": "$p1.serp.format('$link;$anchor\\n')",
"resultsSaveTo": "file",
"resultsFileName": "$datefile.format().csv",
"additionalFormats": [],
"resultsUnique": "string",
"queriesFrom": "text",
"queryFormat": [
"$query"
],
"uniqueQueries": true,
"saveFailedQueries": false,
"iteratorOptions": {
"onAllLevels": false,
"queryBuildersAfterIterator": false,
"queryBuildersOnAllLevels": false
},
"resultsOptions": {
"overwrite": false,
"writeBOM": true
},
"doLog": "db",
"limitLogsCount": "0",
"keepUnique": "No",
"moreOptions": true,
"resultsPrepend": "Link;Anchor\n",
"resultsAppend": "",
"queryBuilders": [],
"resultsBuilders": [],
"configOverrides": [],
"runTaskOnComplete": null,
"useResultsFileAsQueriesFile": false,
"runTaskOnCompleteConfig": "default",
"toolsJS": "",
"prio": 5,
"removeOnComplete": false,
"callURLOnComplete": "",
"queries": [
"test",
"bla-bla"
]
}
}

Przykład odpowiedzi

W odpowiedzi przychodzi id utworzonego zadania.

{
"success": 1,
"data": "697403"
}

Zadanie z zapytaniami z pliku

Aby w zadaniu zapytania były pobierane z pliku, należy ustawić "queriesFrom": "file" oraz ścieżkę(-i) do pliku(-ów) z zapytaniami "queriesFile": ["queries1.txt", "queries2.txt"]. Reszta pozostaje bez zmian, jak w powyższym przykładzie.

Przykład zapytania

{
"password": "pass",
"action": "addTask",
"data": {
"preset": "default",
"configPreset": "100 Threads",
"parsers": [
[
"SE::Google",
"default"
]
],
"resultsFormat": "$p1.preset",
"resultsSaveTo": "file",
"resultsFileName": "$datefile.format().csv",
"additionalFormats": [],
"resultsUnique": "no",
"queriesFrom": "file",
"queryFormat": [
"$query"
],
"uniqueQueries": false,
"saveFailedQueries": false,
"iteratorOptions": {
"onAllLevels": false,
"queryBuildersAfterIterator": false,
"queryBuildersOnAllLevels": false
},
"resultsOptions": {
"overwrite": false,
"writeBOM": false
},
"doLog": "no",
"limitLogsCount": "0",
"keepUnique": "No",
"moreOptions": false,
"resultsPrepend": "",
"resultsAppend": "",
"queryBuilders": [],
"resultsBuilders": [],
"configOverrides": [],
"runTaskOnComplete": null,
"useResultsFileAsQueriesFile": false,
"runTaskOnCompleteConfig": "default",
"toolsJS": "",
"prio": 5,
"removeOnComplete": false,
"callURLOnComplete": "",
"queriesFile": [
"queries/Text Document.txt"
]
}
}

Przykład odpowiedzi

{
"success": 1,
"data": "5432"
}

Uruchomienie wcześniej zapisanego zadania

Można uruchamiać wcześniej utworzony przez interfejs preset. W takim przypadku wystarczy jedynie podać zapytania. Można również nadpisać dowolny z parametrów zadania, zostaną one użyte zamiast wartości w presecie.

Przykład zapytania

{
"password": "pass",
"action": "addTask",
"data": {
"queriesFrom": "text",
"queries": [
"google.com",
"yandex.ru"
],
"configPreset": "default",
"preset": "Analyze Domains"
}
}

Przykład odpowiedzi

{
"success": 1,
"data": "5436"
}

Flaga removeOnRestart

Ta flaga wskazuje, że zadania zostaną usunięte przy restarcie scrapera.

Przykład zapytania

{
"password": "pass",
"action": "addTask",
"data": {
"queriesFrom": "text",
"queries": [
"google.com",
"yandex.ru"
],
"configPreset": "default",
"preset": "Analyze Domains",
"removeOnRestart": 1
}
}

Przykład odpowiedzi

{
"success": 1,
"data": "5437"
}

Flaga removeOnComplete

Ta flaga wskazuje, że zadania zostaną usunięte po zakończeniu.

Przykład zapytania

{
"password": "pass",
"action": "addTask",
"data": {
"queriesFrom": "text",
"queries": [
"google.com",
"yandex.ru"
],
"configPreset": "default",
"preset": "Analyze Domains",
"removeOnComplete": 1
}
}

Przykład odpowiedzi

{
"success": 1,
"data": "5438"
}

info

Pobieranie ogólnych informacji o stanie A-Parser oraz pobieranie listy wszystkich dostępnych scraperów.

wskazówka

Numer aktualnej wersji A-Parser można uzyskać bezpośrednio pod linkiem: https://a-parser.com/members/versions

Przykład: {"lastBetaVersion":"1.2.1484","lastAlphaVersion":"1.2.1484","lastVersion":"1.2.1432"}

Przykład zapytania

{
"password": "pass",
"action": "info"
}

Przykład odpowiedzi

{
"success": 1,
"data": {
"tasksInQueue": 0,
"pid": "13968",
"activeProxyCheckerThreads": 0,
"workingTasks": 0,
"activeThreads": 0,
"version": "1.2.1151",
"availableParsers": [
"API::Server::Redis",
"Check::BackLink",
"Check::RosKomNadzor",
"DeepL::Translator",
"GooglePlay::Apps",
"HTML::EmailExtractor",
...
"Util::AntiGate",
"Util::ReCaptcha2",
"Util::YandexRecognize"
]
}
}

getParserPreset

Pobieranie ustawień wskazanego scrapera i presetu.

wskazówka

Za pomocą tej metody można uzyskać pełną listę parametrów do wykorzystania w innych zapytaniach API.

Przykład zapytania

{
"password": "pass",
"action": "getParserPreset",
"data": {
"parser": "SE::Google",
"preset": "default"
}
}

Przykład odpowiedzi

{
"success": 1,
"data": {
"queryformat": "$query",
"parsenotfound": 1,
"reCaptchaRetries": 3,
"pagecount": 5,
"gl": "",
"proxyChecker": "*",
"hl": "en",
"domain": "www.google.com",
"timeout": 60,
"Util_ReCaptcha2_preset": "default",
"useproxy": 1,
"nfpr": 0,
"extraquery": "",
"serptime": "all",
"location": "",
"usesessions": 1,
"filter": 1,
"linksperpage": 100,
"dontTakeSession": 0,
"addHeaders": "",
"serp": "",
"proxyretries": 10,
"device": "desktop",
"requestdelay": 0,
"debug_nonexists_domains": 0,
"proxybannedcleanup": 600,
"formatresult": "$serp.format('$link\\n')",
"reCaptchaPassProxy": 0,
"lr": ""
}
}

getProxies

Zapytanie o listę aktywnych proxy. Zwracana jest lista aktywnych proxy ze wszystkich proxycheckerów.

Przykład zapytania

{
"password": "pass",
"action": "getProxies"
}

Przykład odpowiedzi

{
"success": 1,
"data": {
"127.0.0.1:23486": [
"socks"
],
"127.0.0.1:23140": [
"socks"
],
"127.0.0.1:21971": [
"http"
]
}
}

IP:port proxy zostanie podany jako nazwa tablicy. Pierwszym elementem tablicy jest typ proxy, może przyjmować 3 wartości - http, socks, socks4. Jeśli określono autoryzację loginem/hasłem, to drugim i trzecim elementem będą login i hasło.

Można również uzyskać listę proxy tylko z określonych proxycheckerów. W tym celu należy dodatkowo przekazać tablicę checkers.

Przykład:

{
"password": "pass",
"action": "getProxies",
"data": {
"checkers": [
"Elite proxies",
"free proxies"
]
}
}

getTaskState

Pobieranie stanu zadania po jego id.

Przykład zapytania

{
"password": "pass",
"action": "getTaskState",
"data": {
"taskUid": "181"
}
}

Przykład odpowiedzi

{
"success": 1,
"data": {
"status": "completed",
"stats": "<b>Overall stats</b><br>Runtime: 0:00:19<br>HTTP requests: 464<br><br><b>1. HTML::LinkExtractor</b><br>Queries done: 254<br>Successful queries: 252<br>Proxies used: 0 (per query)<br>Retries used: 1.07 (per query)<br>HTTP requests: 1.82 (per query)",
"state": {
"totalFail": 2,
"totalWaitProxyThreads": 0,
"minimized": 0,
"queriesDoneCount": 254,
"avgSpeed": 802,
"activeThreads": 0,
"startTime": 1507281122,
"changeTime": 1507281141,
"queriesCount": 1,
"logExists": 0,
"runTime": 19,
"uniqueResultsCount": 656,
"requests": "464",
"addTime": 1507281120,
"additionalCount": 253,
"queriesDoneCountAtStart": 0,
"lastQuery": "https://www.nytimes.com/ref/membercenter/help/infoservdirectory.html",
"curSpeed": 846,
"started": 1,
"resultsCount": 31079
}
}
}

W odpowiedzi zwracany jest status zadania (status) i jego statystyki (state).

Można również uzyskać informacje o kilku zadaniach naraz, w tym celu należy przekazać tablicę id.

Przykład zapytania

{
"password": "pass",
"action": "getTaskState",
"data": {
"taskUid": [
"22",
"23",
"31"
]
}
}

W takim przypadku w odpowiedzi znajdzie się tablica z danymi dla każdego zadania.

Przykład odpowiedzi

{
"success": 1,
"data": [
{
"status": "completed",
"stats": "<b>Overall stats</b><br>Runtime: 0:00:01<br>HTTP requests: 0<br><br><b>1. SE::Bing</b><br>Queries done: 0<br>Successful queries: 0<br>Proxies used: 0 (per query)<br>Retries used: 0 (per query)<br>HTTP requests: 0 (per query)",
"state": {
"totalFail": 0,
"totalWaitProxyThreads": 0,
"minimized": 0,
"queriesDoneCount": 0,
"avgSpeed": 0,
"activeThreads": 0,
"startTime": 1507023540,
"changeTime": 1507023541,
"queriesCount": 1,
"logExists": 1,
"runTime": 1,
"uniqueResultsCount": 0,
"requests": 0,
"addTime": 1507023443,
"additionalCount": 0,
"queriesDoneCountAtStart": 0,
"lastQuery": "none",
"curSpeed": 0,
"started": 1,
"resultsCount": 0
}
},
...dane dla pozostałych zadań...
]
}

getTaskConf

Pobieranie konfiguracji zadania po jego id.

Przykład zapytania

{
"password": "pass",
"action": "getTaskConf",
"data": {
"taskUid": "181"
}
}

Przykład odpowiedzi

W odpowiedzi zwracane są ustawienia zadania, w tym z wynikową nazwą pliku.

{
"success": 1,
"data": {
"parsers": [
[
"SE::Bing",
"default",
{
"value": 1,
"type": "override",
"id": "pagecount"
}
]
],
"resultsFileName": "Mar-05_13-12-23.txt",
"runTaskOnComplete": null,
"limitLogsCount": "0",
"resultsPrepend": "",
"origResultsFileName": "$datefile.format().txt",
"queriesFrom": "text",
"runTaskOnCompleteConfig": "default",
"doLog": "db",
"useResultsFileAsQueriesFile": 0,
"additionalFormats": [],
"resultsSaveTo": "file",
"callURLOnComplete": "",
"resultsFormat": "$p1.related.format('$key\\n')",
"queryBuilders": [],
"preset": "default",
"resultsAppend": "",
"uniqueQueries": 0,
"keepUnique": 0,
"prio": "5",
"saveFailedQueries": 0,
"configPreset": "100 Threads",
"queries": [
"test"
],
"toolsJS": "",
"moreOptions": 0,
"resultsBuilders": [],
"resultsUnique": "string",
"iteratorOptions": {
"onAllLevels": 0,
"queryBuildersAfterIterator": 0,
"queryBuildersOnAllLevels": 0
},
"removeOnComplete": 0,
"queryFormat": [
"$query"
],
"configOverrides": [],
"resultsOptions": {
"overwrite": 0,
"writeBOM": 0
}
}
}

getTaskResultsFile

Pobieranie linku do pobrania wyniku po id zadania. Pod otrzymanym linkiem można pobrać plik tylko raz, bez autoryzacji (używany jest token jednorazowy).

notatka

Działa tylko ze statyczną nazwą pliku i $datefile.format(). Aby zamienić dynamiczną nazwę pliku wyniku na statyczną, można użyć flagi silnika szablonów isStaticTemplate()

Przykład zapytania

{
"password": "pass",
"action": "getTaskResultsFile",
"data": {
"taskUid": "181"
}
}

Przykład odpowiedzi

{
"success": 1,
"data": "http://127.0.0.1:9091/downloadResults?fileName=Mar-05_13-12-23.txt&token=wbvwlkes"
}

getTasksList

Pobieranie listy aktywnych zadań. Jeśli przekażesz dodatkowy parametr completed: 1, otrzymasz listę zakończonych zadań.

Przykład zapytania

{
"password": "pass",
"action": "getTasksList",
"data": {
"completed": "1"
}
}

Przykład odpowiedzi

{
"success": 1,
"data": [
"2291",
"2324",
"2331",
"2384",
"2398",
"2434",
"2445",
"3482",
...
]
}

getParserInfo

Wyświetla listę wszystkich dostępnych wyników, które może zwrócić dany scraper.

Przykład zapytania

{
"password" : "pass",
"action" : "getParserInfo",
"data" : {
"parser" : "SE::Google"
}
}

Przykład odpowiedzi

{
"success": 1,
"data": {
"results": {
"arrays": {
"ads": [
"Ads list",
[
[
"link",
"Link"
],
...
]
],
"related": [
"Related keywords",
[
[
"key",
"Key"
]
]
],
"rich": [
"Rich snippets list",
[
[
"name",
"Name"
]
]
],
"serp": [
"Main serp list",
[
[
"link",
"Link"
],
...
]
],
"pages": [
"Raw data array",
[
[
"data",
"Raw data"
]
]
]
},
"flat": [
[
"query",
"Formatted query"
],
...
]
}
}
}

getAccountsCount

Pobieranie liczby aktywnych kont Yandex.

Przykład zapytania

{
"password": "pass",
"action": "getAccountsCount"
}

Przykład odpowiedzi

{
"success": 1,
"data": {
"SE::Yandex": 18
}
}

deleteTaskResultsFile

Usuwanie pliku wyniku po id zadania.

Przykład zapytania

{
"password": "pass",
"action": "deleteTaskResultsFile",
"data": {
"taskUid": "181"
}
}

Przykład odpowiedzi

{
"success": 1
}

changeTaskStatus

Zmiana statusu zadania po jego id. Istnieją tylko 4 stany, w które można przenieść zadanie:

  • starting - uruchomienie zadania
  • pausing - wstrzymanie zadania
  • stopping - zatrzymanie zadania
  • deleting - usunięcie zadania

Przykład zapytania

{
"password": "pass",
"action": "changeTaskStatus",
"data": {
"taskUid": "181",
"toStatus": "deleting"
}
}

Przykład odpowiedzi

{
"success": 1
}

changeProxyCheckerState

Zmiana stanu proxycheckera (1 - włączony / 0 - wyłączony).

Przykład zapytania

{
"password": "pass",
"action": "changeProxyCheckerState",
"data": {
"checker": "proxychecker name",
"state": 1
}
}

Przykład odpowiedzi

{
"success": 1
}

moveTask

Przenoszenie zadania w kolejce po jego id. Możliwe kierunki przenoszenia:

  • start - na początek kolejki
  • end - na koniec kolejki
  • up - o jedną pozycję w górę
  • down - o jedną pozycję w dół

Przykład zapytania

{
"password": "pass",
"action": "moveTask",
"data": {
"taskUid": "181",
"direction": "start"
}
}

Przykład odpowiedzi

{
"success": 1
}

update

Aktualizuje plik wykonywalny scrapera do najnowszej dostępnej wersji. Po wysłaniu polecenia A-Parser zostanie automatycznie zrestartowany. API zwróci odpowiedź o sukcesie po pobraniu i zaktualizowaniu pliku wykonywalnego, co może zająć 1-3 minuty.

Przykład zapytania

{
"password": "pass",
"action": "update"
}

Przykład odpowiedzi

{
"success": 1
}