Vai al contenuto principale

Rank::MajesticSEO - Scraper del numero di backlink dal servizio majesticseo.com

Panoramica dello scraper

Lo scraper Majestic è uno degli scraper più richiesti per gli specialisti SEO, poiché consente di ottenere indicatori cruciali come Trust Flow e Citation Flow. Con l'aiuto dello scraper automatico multithreading Majestic, puoi raccogliere i seguenti dati: numero di domini referenti, backlink, pagine indicizzate.

Le funzionalità di A-Parser consentono di salvare le impostazioni di scraping per un uso futuro (preset), impostare pianificazioni di scraping e molto altro.

Grazie al funzionamento in multithreading di A-Parser, la velocità di elaborazione delle query può raggiungere 100 query al minuto utilizzando solo 50 thread.

Panoramica dello scraper: velocità operativa

Il salvataggio dei risultati è possibile nel formato e nella struttura necessari, grazie al potente motore di modelli integrato Template Toolkit che consente di applicare logiche aggiuntive ai risultati e di esportare i dati in vari formati, tra cui JSON, SQL e CSV.

Dati raccolti

I dati vengono raccolti dal servizio www.majesticseo.com

  • Numero di domini referenti
  • Numero di backlink
  • Numero di pagine indicizzate
  • Indicatori Trust Flow e Citation Flow

Casi d'uso

  • Ottenimento di informazioni riepilogative sul dominio
  • Valutazione del numero di backlink
  • Valutazione del traffico sul dominio

Query

Come query è necessario specificare un elenco di domini, ad esempio:

a-parser.com  
yandex.ru
google.com
vk.com
facebook.com
youtube.com

Esempi di output dei risultati

A-Parser supporta una formattazione flessibile dei risultati grazie al motore di modelli integrato Template Toolkit, che gli consente di produrre risultati in forma libera o strutturata, come CSV o JSON.

Esportazione dell'elenco dei risultati

Formato del risultato:

$query - domains: $domains, backlinks: $backlinks, trust: $trustflow, citation: $citationflow, indexed: $indexed\n

Il risultato mostra il dominio, il numero di backlink, il numero di indirizzi IP referenti, trust, citation e pagine indicizzate.

Esempio di risultato:

facebook.com - domains: 28384898, backlinks: 83357892873, trust: 99, citation: 99, indexed: 6743835203
a-parser.com - domains: 380, backlinks: 90219, trust: 12, citation: 38, indexed: 16121
yandex.ru - domains: 592182, backlinks: 1751277762, trust: 88, citation: 82, indexed: 92468056
google.com - domains: 21134537, backlinks: 32206959211, trust: 100, citation: 100, indexed: 3278520318
vk.com - domains: 1145676, backlinks: 3235015237, trust: 90, citation: 85, indexed: 372205938
...

Output in tabella CSV

L'utility integrata $tools.CSVLine consente di creare documenti tabulari corretti, pronti per l'importazione in Excel o Google Fogli.

Formato del risultato:

[% tools.CSVline(query.orig,domains,trustflow,citationflow,indexed) %]

Nome del file:

$datefile.format().csv

Testo iniziale:

Dominio,Domini referenti,Trust,Citazione,Indicizzazione

Esempio di risultato:

Dominio,Domini referenti,Trust,Citazione,Indicizzazione
a-parser.com,380,12,38,16121
yandex.ru,592182,88,82,92468056
vk.com,1145676,90,85,372205938
facebook.com,28384898,99,99,6743835203
google.com,21134537,100,100,3278520318
suggerimento

Nel Formato dei risultati viene applicato il motore di modelli Template Toolkit per l'output dei risultati.

Nel nome del file dei risultati è sufficiente cambiare l'estensione del file in csv.

Affinché l'opzione "Prepend text" sia disponibile nell'Editor delle attività, è necessario attivare "More options". In "Prepend text" scriviamo i nomi delle colonne separati da virgola e lasciamo la seconda riga vuota.

Salvataggio in formato SQL

Formato del risultato:

INSERT INTO serp VALUES('$query.orig', '$domains', '$backlinks', '$trustflow', '$citationflow', '$indexed')\n

Esempio di risultato:

INSERT INTO serp VALUES('google.com', '21134537', '32206959211', '100', '100', '3278520318')
INSERT INTO serp VALUES('vk.com', '1145676', '3235015237', '90', '85', '372205938')
INSERT INTO serp VALUES('yandex.ru', '592182', '1751277762', '88', '82', '92468056')
INSERT INTO serp VALUES('a-parser.com', '380', '90219', '12', '38', '16121')
INSERT INTO serp VALUES('facebook.com', '28384898', '83357892873', '99', '99', '6743835203')

Dump dei risultati in JSON

Formato comune del risultato:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.query = p1.query.orig;
obj.indexed = p1.indexed;
obj.domains = p1.domains;
obj.citationflow = p1.citationflow;
obj.trustflow = p1.trustflow;
obj.backlinks = p1.backlinks;

obj.json %]

Testo iniziale:

[

Testo finale:

]

Esempio di risultato:

[
{"indexed":"372205938","domains":"1145676","citationflow":"85","query":"vk.com","trustflow":"90","backlinks":"3235015237"},
{"indexed":"92468056","domains":"592182","citationflow":"82","query":"yandex.ru","trustflow":"88","backlinks":"1751277762"},
{"indexed":"6743835203","domains":"28384898","citationflow":"99","query":"facebook.com","trustflow":"99","backlinks":"83357892873"},
{"indexed":"3278520318","domains":"21134537","citationflow":"100","query":"google.com","trustflow":"100","backlinks":"32206959211"},
{"indexed":"16121","domains":"380","citationflow":"38","query":"a-parser.com","trustflow":"12","backlinks":"90219"}
]
suggerimento

Affinché le opzioni "Prepend text" e "Append text" siano disponibili nell'Editor delle attività, è necessario attivare "More options".

Elaborazione dei risultati

A-Parser consente di elaborare i risultati direttamente durante lo scraping; in questa sezione abbiamo riportato i casi più popolari per lo scraper Rank::MajesticSEO.

Salvataggio dei domini con il trust desiderato

Aggiungere un filtro e nel menu a discesa selezionare la variabile del valore di controllo $trustflow - Trust flow. Scegliere il tipo, ad esempio: >. Successivamente, in Number (Numero), inserire il valore desiderato 10. Con questo filtro potrai rimuovere tutti i risultati con un valore di Trust flow inferiore a 10.

Esempio di utilizzo di un filtro
Scarica esempio

Come importare l'esempio in A-Parser

eJx9VFFP20AM/ivRCaRNggoe9lK0SQWt0iagDMpT24cjcbqjl3O4u5RWUf479iW9
tMD21Nr+7LM/f3EtvHQrd2fBgXdiOKtFGf6LobiXZjUc3shncF6lDz8nyWkyVtqD
TWAji1KDOBGltA4sZ84+JlA8g1xW2ouTWvhtCVQW12CtyjhZZWSXFjdbC94qcORb
S10x7PzsTDT/zgruHm0R/f/g6V+LxV6CtxXswfMwFoVpdu6W6tvK+VzjKznb6LSF
/jjokQwsvUJDlgPjRLNY7Kq4MdpCcrHZcZJJL5PvSd1cJMncsDV4qcBuyVeet38H
aNXyYhfNsJDKuDbeGTH4JNOVVmbVhaMZAbH9FhDNCEiVl9x3j9n3RJgyGWwgaxGd
wcHjxVGIPzs087mJzLkHuYYptpRC7ybdwK0smDROBI4O8sDPl68DvyGBCJllihuQ
uiWORdWT+WjUSyDdIGGZMNLLmLbKy4JQILC4I30mjoItqEQVcv+0OWKYS+3gRDhq
dSypkex9RNG6pUc7Caslfy3QjLS+hjXoHhbqX1ZKZ/QFjHJK+tUlfg6ZfKjRxPH2
nyLtvlrqIVYJ1uXkps/K8BqXNHn2RHNrVShPtrvCyrDeWJYrgDJydsucFWghPtNV
7l6n778Ewx9Kv7JR2bsOxjhYy6EzJfmo5aT7+HbIykzpyEzMFfLR4LlMpTWtxcF9
L4+R69bARt/g++Sr8ASPvrsswiNq9/uhbbW0iuT3jRssiMn9V7uSqdT68f56PyJ6
SZEhT9urNkixmJutZNkPbDU3S8Ql6Ta416v2N5cpPCF2luDyHpZIwqPhm0W8kPHE
1p/cyWHd0FKf3V2LZQYYST6i0oXzct68AXxQ/Fc=
suggerimento

Impostazioni possibili

Nome parametroValore predefinitoDescrizione
Check typeRoot domainConsente di scegliere il tipo di controllo: Root Domain / Subdomain / URL
Use Chrome (Slow)Specifica di utilizzare il browser Chrome per tutte le richieste
Use Headless mode for ChromeUtilizzare la modalità Headless per le richieste tramite browser
Use Stealth mode for ChromeMascherare l'uso del browser durante le richieste tramite browser
Use HTTP2 for requests without ChromeUtilizzare HTTP/2 per le richieste senza browser
Emulate browser headers for requests without ChromeEmulare gli header del browser per le richieste senza browser
User-agent for requests without Chrome[% tools.ua.random() %]Sovrascrittura dello User-Agent per le richieste senza browser
Additional headers for requests without ChromeAccept, Accept-Encoding, Accept-LanguageConsente di impostare gli header per le richieste senza browser. Funziona in modo analogo a Additional headers in Net::HTTPNet::HTTP.