Hoppa till huvudinnehåll

Rank::MajesticSEO - Scraper för antal backlänkar från tjänsten majesticseo.com

Översikt av scrapern

Majestic-scrapern är en av de mest efterfrågade scraperna för SEO-specialister eftersom den gör det möjligt att erhålla så viktiga mätvärden som Trust Flow och Citation Flow. Med hjälp av den automatiserade flertrådade Majestic-scrapern kan du skrapa följande data: antal länkande domäner, back-länkar, indexerade sidor.

Funktionaliteten i A-Parser gör det möjligt att spara inställningar för dataskrapning för framtida bruk (förinställningar), schemalägga dataskrapning och mycket mer.

Tack vare flertrådningen i A-Parser kan hastigheten för bearbetning av förfrågningar nå 100 förfrågningar per minut med endast 50 trådar.

Översikt av scrapern: arbetshastighet

Det är möjligt att spara resultaten i den form och struktur som du behöver, tack vare den inbyggda kraftfulla mallmotorn Template Toolkit som gör det möjligt att tillämpa ytterligare logik på resultaten och exportera data i olika format, inklusive JSON, SQL och CSV.

Insamlade data

Data samlas in från tjänsten www.majesticseo.com

  • Antal länkande domäner
  • Antal back-länkar
  • Antal indexerade sidor
  • Mätvärden för Trust Flow och Citation Flow

Användningsfall

  • Erhålla sammanfattande information om en domän
  • Bedömning av antal bakåtlänkar
  • Bedömning av trafik på domänen

Förfrågningar

Som förfrågningar måste en lista över domäner anges, till exempel:

a-parser.com  
yandex.ru
google.com
vk.com
facebook.com
youtube.com

Alternativ för resultatutmatning

A-Parser stöder flexibel formatering av resultat tack vare den inbyggda mallmotorn Template Toolkit, vilket gör att den kan mata ut resultat i valfri form, såväl som i strukturerad form, till exempel CSV eller JSON

Export av resultatlista

Resultatformat:

$query - domains: $domains, backlinks: $backlinks, trust: $trustflow, citation: $citationflow, indexed: $indexed\n

Resultatet visar domän, antal back-länkar, antal länkande IP-adresser, trust, citation, indexerade sidor.

Exempel på resultat:

facebook.com - domains: 28384898, backlinks: 83357892873, trust: 99, citation: 99, indexed: 6743835203
a-parser.com - domains: 380, backlinks: 90219, trust: 12, citation: 38, indexed: 16121
yandex.ru - domains: 592182, backlinks: 1751277762, trust: 88, citation: 82, indexed: 92468056
google.com - domains: 21134537, backlinks: 32206959211, trust: 100, citation: 100, indexed: 3278520318
vk.com - domains: 1145676, backlinks: 3235015237, trust: 90, citation: 85, indexed: 372205938
...

Utmatning till CSV-tabell

Det inbyggda verktyget $tools.CSVLine gör det möjligt att skapa korrekta tabelldokument, redo för import till Excel eller Google Kalkylark.

Resultatformat:

[% tools.CSVline(query.orig,domains,trustflow,citationflow,indexed) %]

Filnamn:

$datefile.format().csv

Inledande text:

Domän,Länkande domäner,Trust,Citation,Indexering

Exempel på resultat:

Domän,Länkande domäner,Trust,Citation,Indexering
a-parser.com,380,12,38,16121
yandex.ru,592182,88,82,92468056
vk.com,1145676,90,85,372205938
facebook.com,28384898,99,99,6743835203
google.com,21134537,100,100,3278520318
tips

I resultatformatet används mallmotorn Template Toolkit för att mata ut resultaten.

I resultatfilnamnet behöver du bara ändra filändelsen till csv.

För att alternativet "Prepend text" ska vara tillgängligt i Task Editor, måste du aktivera "More options". I "Prepend text" skriver vi kolumnnamnen separerade med kommatecken och gör den andra raden tom.

Spara i SQL-format

Resultatformat:

INSERT INTO serp VALUES('$query.orig', '$domains', '$backlinks', '$trustflow', '$citationflow', '$indexed')\n

Exempel på resultat:

INSERT INTO serp VALUES('google.com', '21134537', '32206959211', '100', '100', '3278520318')
INSERT INTO serp VALUES('vk.com', '1145676', '3235015237', '90', '85', '372205938')
INSERT INTO serp VALUES('yandex.ru', '592182', '1751277762', '88', '82', '92468056')
INSERT INTO serp VALUES('a-parser.com', '380', '90219', '12', '38', '16121')
INSERT INTO serp VALUES('facebook.com', '28384898', '83357892873', '99', '99', '6743835203')

Dumpa resultat till JSON

Allmänt resultatformat:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.query = p1.query.orig;
obj.indexed = p1.indexed;
obj.domains = p1.domains;
obj.citationflow = p1.citationflow;
obj.trustflow = p1.trustflow;
obj.backlinks = p1.backlinks;

obj.json %]

Starttext:

[

Sluttext:

]

Exempel på resultat:

[
{"indexed":"372205938","domains":"1145676","citationflow":"85","query":"vk.com","trustflow":"90","backlinks":"3235015237"},
{"indexed":"92468056","domains":"592182","citationflow":"82","query":"yandex.ru","trustflow":"88","backlinks":"1751277762"},
{"indexed":"6743835203","domains":"28384898","citationflow":"99","query":"facebook.com","trustflow":"99","backlinks":"83357892873"},
{"indexed":"3278520318","domains":"21134537","citationflow":"100","query":"google.com","trustflow":"100","backlinks":"32206959211"},
{"indexed":"16121","domains":"380","citationflow":"38","query":"a-parser.com","trustflow":"12","backlinks":"90219"}
]
tips

För att alternativen "Prepend text" och "Append text" ska vara tillgängliga i Task Editor, måste du aktivera "More options".

Bearbetning av resultat

A-Parser gör det möjligt att bearbeta resultat direkt under dataskrapningen, i det här avsnittet har vi listat de mest populära fallen för scrapern Rank::MajesticSEO

Spara domäner med önskad trust

Lägg till ett filter och välj variabeln för kontrollvärdet $trustflow - Trust flow i rullgardinslistan. Välj typ, till exempel: >. Därefter måste du i Number (Nummer) skriva in det värde som vi behöver, t.ex. 10. Med ett sådant filter kan du ta bort alla resultat med ett Trust flow-värde som är mindre än 10.

Exempel på användning av filter
Ladda ner exempel

Hur man importerar ett exempel till A-Parser

eJx9VFFP20AM/ivRCaRNggoe9lK0SQWt0iagDMpT24cjcbqjl3O4u5RWUf479iW9
tMD21Nr+7LM/f3EtvHQrd2fBgXdiOKtFGf6LobiXZjUc3shncF6lDz8nyWkyVtqD
TWAji1KDOBGltA4sZ84+JlA8g1xW2ouTWvhtCVQW12CtyjhZZWSXFjdbC94qcORb
S10x7PzsTDT/zgruHm0R/f/g6V+LxV6CtxXswfMwFoVpdu6W6tvK+VzjKznb6LSF
/jjokQwsvUJDlgPjRLNY7Kq4MdpCcrHZcZJJL5PvSd1cJMncsDV4qcBuyVeet38H
aNXyYhfNsJDKuDbeGTH4JNOVVmbVhaMZAbH9FhDNCEiVl9x3j9n3RJgyGWwgaxGd
wcHjxVGIPzs087mJzLkHuYYptpRC7ybdwK0smDROBI4O8sDPl68DvyGBCJllihuQ
uiWORdWT+WjUSyDdIGGZMNLLmLbKy4JQILC4I30mjoItqEQVcv+0OWKYS+3gRDhq
dSypkex9RNG6pUc7Caslfy3QjLS+hjXoHhbqX1ZKZ/QFjHJK+tUlfg6ZfKjRxPH2
nyLtvlrqIVYJ1uXkps/K8BqXNHn2RHNrVShPtrvCyrDeWJYrgDJydsucFWghPtNV
7l6n778Ewx9Kv7JR2bsOxjhYy6EzJfmo5aT7+HbIykzpyEzMFfLR4LlMpTWtxcF9
L4+R69bARt/g++Sr8ASPvrsswiNq9/uhbbW0iuT3jRssiMn9V7uSqdT68f56PyJ6
SZEhT9urNkixmJutZNkPbDU3S8Ql6Ta416v2N5cpPCF2luDyHpZIwqPhm0W8kPHE
1p/cyWHd0FKf3V2LZQYYST6i0oXzct68AXxQ/Fc=
tips

Se även: Resultatfilter

Möjliga inställningar

ParameternamnStandardvärdeBeskrivning
Check typeRoot domainGör det möjligt att välja typ av kontroll: Root Domain / Subdomain / URL
Use Chrome (Slow)Anger att webbläsaren Chrome ska användas för alla förfrågningar
Use Headless mode for ChromeAnvänd Headless-läge för förfrågningar via webbläsare
Use Stealth mode for ChromeMaskera webbläsaranvändning vid förfrågningar via webbläsare
Use HTTP2 for requests without ChromeAnvänd HTTP/2 för förfrågningar utan webbläsare
Emulate browser headers for requests without ChromeEmulera webbläsarheadrar vid förfrågningar utan webbläsare
User-agent for requests without Chrome[% tools.ua.random() %]Överskridande av user-agent för förfrågningar utan webbläsare
Additional headers for requests without ChromeAccept, Accept-Encoding, Accept-LanguageGör det möjligt att ange headrar för förfrågningar utan webbläsare. Fungerar på samma sätt som Additional headers i Net::HTTPNet::HTTP.