Zum Hauptinhalt springen

Check::BackLink - prüft das Vorhandensein von Links in einer Linkdatenbank

Übersicht des Parsers

Übersicht des Parsers: Arbeitsgeschwindigkeit

Der Parser ermöglicht die Überprüfung von Backlinks, also Links auf Webseiten, die auf Ihre Website verweisen.

Die Funktionalität von A-Parser erlaubt es, Datenerfassungseinstellungen für die spätere Verwendung zu speichern (Presets), Zeitpläne für die Datenerfassung festzulegen und vieles mehr.

Das Speichern der Ergebnisse ist in der von Ihnen benötigten Form und Struktur möglich, dank der integrierten leistungsstarken Template-Engine Template Toolkit, die es ermöglicht, zusätzliche Logik auf die Ergebnisse anzuwenden und Daten in verschiedenen Formaten auszugeben, einschließlich JSON, SQL und CSV.

Anwendungsbeispiele für den Parser

Gesammelte Daten

  • Summe der externen und internen Links auf der Seite
  • Überprüft das Vorhandensein des Links auf der angegebenen Seite: 0 und 1
    • 0 - bedeutet, dass keine exakte Übereinstimmung des Backlinks vorliegt
    • 1 - bedeutet, dass eine exakte Übereinstimmung des Backlinks vorliegt
  • Blockierung der angegebenen Seite für die Anzeige über robots.txt - 0 und 1
  • Blockierung der Indexierung der Seite über das Robots-Metatag mit dem Attribut noindex sowie Blockierung des Folgens des Links über das Attribut nofollow
  • Blockierung des Folgens des Links über das Attribut rel=nofollow

Zusätzliche Daten, die abgerufen werden können:

  • Anzahl der externen und internen Links auf der Seite
  • Liste aller externen und internen Links auf der Seite

Funktionen

  • Überprüft das Vorhandensein des Links auf der angegebenen Seite, mit der Möglichkeit, den Link ohne Angabe des Schemas nach Übereinstimmung der Zeichenfolge zu suchen
  • Überprüft, ob die Seite über die robots.txt von der Indexierung ausgeschlossen ist
  • Überprüft das Robots-Metatag auf das Vorhandensein der Attribute noindex und nofollow
  • Überprüft das Vorhandensein von rel=nofollow beim gefundenen Link
  • Suche nach dem Link durch Übereinstimmung der Zeichenfolge
  • Möglichkeit, einen eigenen User-Agent Header anzugeben

Anwendungsfälle

  • Überprüfung der Platzierung eigener Links auf den angegebenen Seiten
  • Suche nach Links, die nur einem bestimmten User-Agent angezeigt werden (z. B. für den Google-Bot)

Anfragen

Als Anfragen müssen die Seite, auf der nach dem Link gesucht werden soll, und durch ein Leerzeichen getrennt der gesuchte Link angegeben werden:

https://fishki.net/ https://lenta.ru/news/2020/12/18/lavina/
https://en.wikipedia.org/wiki/Moscow https://lenta.ru/news/2005/12/23/city/
http://soccerjerseys.in.net/ https://lenta.ru/news/2012/03/12/homeless/
https://tjournal.ru/ https://lenta.ru/articles/2016/02/15/deathlab/

Abfrage-Substitutionen

Sie können integrierte Makros für die automatische Ersetzung von Unterabfragen aus Dateien verwenden. Wenn wir beispielsweise Websites anhand einer Seitenliste überprüfen möchten, geben wir die Liste der Seiten an, auf denen nach Links gesucht werden soll:

https://fishki.net/
https://en.wikipedia.org/wiki/Moscow
http://soccerjerseys.in.net/
https://tjournal.ru/

Im Abfrageformat geben wir das Makro zur Ersetzung zusätzlicher Abfragen aus der Datei backlinks.txt an. Diese Methode ermöglicht es, eine Basis von Websites auf das Vorhandensein einer Liste von Links aus einer Datei zu überprüfen:

$query {subs:backlinks}

Dieses Makro erstellt für jede ursprüngliche Suchanfrage so viele zusätzliche Anfragen, wie in der Datei enthalten sind, was in der Summe [Anzahl der ursprünglichen Anfragen (Seitenlinks)] x [Anzahl der Anfragen in der Datei backlinks] = [Gesamtanzahl der Anfragen] als Ergebnis der Makroarbeit ergibt.

Man kann im Abfrageformat auch das Protokoll angeben, damit nur Domains als Anfragen verwendet werden können:

http://$query 

Dieses Format stellt jedem Query http:// voran.

Ausgabebeispiele

A-Parser unterstützt eine flexible Formatierung der Ergebnisse dank der integrierten Template-Engine Template Toolkit, was es ermöglicht, Ergebnisse in beliebiger Form sowie strukturiert, zum Beispiel als CSV oder JSON, auszugeben.

Standardausgabe

Ergebnisformat:

$backlink - $checklink: $exists, blocked by robots.txt: $robots\n

Beispielergebnis, in dem der Backlink, der Link zur Seite, auf der die Backlink-Suche stattfindet, das Vorhandensein oder Fehlen des Backlinks und die Überprüfung der Seite auf Blockierung in der robots.txt-Datei angezeigt werden:

http://soccerjerseys.in.net/ - https://lenta.ru/news/2012/03/12/homeless/: 1, blocked by robots.txt: 0
https://tjournal.ru/ - https://lenta.ru/articles/2016/02/15/deathlab/: 0, blocked by robots.txt: 0
https://en.wikipedia.org/wiki/Moscow - https://lenta.ru/news/2005/12/23/city/: 0, blocked by robots.txt: 0
https://fishki.net/ - https://lenta.ru/news/2020/12/18/lavina/: 0, blocked by robots.txt: 0

Ausgabe des Vorhandenseins von Backlinks und zusätzlicher Parameter zur Analyse von Backlinks und Seiten mit Backlinks in eine CSV-Tabelle

Das integrierte Tool $tools.CSVLine ermöglicht die Erstellung korrekter Tabellendokumente, die für den Import in Excel oder Google Sheets bereit sind.

Das Ergebnis der Variable $actualchecklink ist nur dann vorhanden, wenn auf der Seite ein Backlink existiert; wenn kein Backlink vorhanden ist, ist das Ergebnis dieser Variable none. $actualbacklink und $actualchecklink sind die realen Links nach einem Redirect.

Ergebnisformat:

[% tools.CSVline(backlink, checklink, anchor, nofollow, noindex, redirect, exists, robots, actualbacklink, actualchecklink, intcount, extcount) %]

Dateiname:

$datefile.format().csv

Anfangstext:

Backlink,Checklink,Anchor,Nofollow,Noindex,Redirect,Exists,Robots,Actualbacklink,Actualchecklink,Intlinks count,Extlinks count

Beispielergebnis:

https://tjournal.ru/,https://lenta.ru/articles/2016/02/15/deathlab/,none,0,0,0,0,0,https://tjournal.ru/,none,112,37
https://fishki.net/,https://lenta.ru/news/2020/12/18/lavina/,none,0,0,0,0,0,https://fishki.net/,none,966,31
http://soccerjerseys.in.net/,https://lenta.ru/news/2012/03/12/homeless/,"get more information",0,0,0,1,0,http://soccerjerseys.in.net/,https://lenta.ru/news/2012/03/12/homeless/,89,20
https://en.wikipedia.org/wiki/Moscow,https://lenta.ru/news/2005/12/23/city/,none,0,0,0,0,0,https://en.wikipedia.org/wiki/Moscow,none,2733,598
...
Beispiel herunterladen

Wie man ein Beispiel in A-Parser importiert

eJx9VE1v4jAQ/SuR1UqtRGOg6mqVG6AidUWhS9u9UA5uMgE3jp21HaBC/Pcd5xPK
7t484zdvxjNvvCeWmcQ8aTBgDQkWe5IVZxKQ+x1LMwFeuIYw8d5ZmAguE+OxKPIy
plkKFrQhHYKGcadgsSAjBw6CIaIniMbbCGKWC0uWyw5BajyasdIpcykWlzeeVUoY
f/T8C9nhKuv5daaOh0aRvLGYDNdKF0epYiWE2lYGlxHsirOGiGsIbWHAjhtrSr96
V9WRhTZn4iRP6TrNxqUNVS5rptK49m4ul6R5yjPbwIvCp8RcQOseozXFDuHFRcQs
uFs/Lp59de3bnUUo9pFbriQTZT9cA9sevUr+O3fxUiEWj5qDGWuVostCQeCcn3Uv
F+SisAlS5EXszzKGBDETBjrEYKljhoVEX284DpJZpWeZqwf9e6LkQIgJbEC0sIJ/
mHMR4bQHMQY9VIF/h8zOOA7N845TbUBvNdbQsBTWcPbYRkVqolZ1MwRPuUXbjNxA
0NtFZwKQNT2bOliqNDRprM6hSY5yz0BGCBzWGhg1kx+UGpvW+ppW2prXurovNTUv
9TQ41dLgi44epC23plTS/e7YfJOtYgZZVRL50sUTVZw6QyVjvpph/zSPoEbm8gV3
eiZHyq2va6vMhUBVGJi36hyYSgXOaDp/FjwqUmBZ9Rp3SLGwP57LUjPNUf13rsAU
B3mctaIMmRCv88nxDWkVjcba2swElMbcrBPuS7DUq30CpGW+zqmEraH9br9Le33a
+04F23DJ6JuskSD9LU94hlNivtIr6iz6qEyotv+k6945uv4tDbn9rMgQZlQYgv7A
PsOnwW/g/zUhQ/fW8axVCgKMOarKfqhc44Y7+DkB05aHGOFIvtEuPuyORsDsWrB3
SlzrLKwU7jQO9rBsPtrmt96ffbfB/oDb8mGeSqSbrcOhD0VicBVI0Dv8AQ3PGZI=

Tipp

Im Ergebnisformat wird die Template-Engine Template Toolkit angewendet.

Was ist das Ergebnis format.

Im Namen der Ergebnisdatei muss einfach die Dateiendung in csv geändert werden.

Damit die Option "Anfangstext" im Task-Editor verfügbar ist, muss "Mehr Optionen" aktiviert werden. In den "Anfangstext" schreiben wir die Spaltennamen durch Kommata getrennt und machen die zweite Zeile leer.

Dump externer Links von der Backlink-Seite in JSON

Ergebnisformat:

[% data = {}; 
data.query = query; data.links = [];
FOREACH item IN extlinks;
data.links.push(item.link);
END;
IF !firstString;
",\n";
ELSE;
firstString = 0;
END;
data.json %]

Anfangstext:

[% firstString = 1 %][

Endtext:

]

Beispielergebnis:

[{"query":"https://tjournal.ru/ https://lenta.ru/articles/2016/02/15/deathlab/","links":["https://vc.ru/job","https://vc.ru/job/new","https://vc.ru/job","https://twitter.com/aktroitsky","https://twitter.com/aktroitsky/statuses/1382294384931188748","https://twitter.com/aktroitsky/statuses/1382294384931188748","https://t.co/fD4AiCpbrV","https://twitter.com/aktroitsky/statuses/1382294384931188748"]}]

Verarbeitung der Ergebnisse

A-Parser ermöglicht es, Ergebnisse direkt während der Datenerfassung zu verarbeiten. In diesem Abschnitt haben wir die beliebtesten Anwendungsfälle für den Check::BackLink Parser aufgeführt.

Fügen Sie einen Filter hinzu und wählen Sie in der Dropdown-Liste die Trust-Variable $exists - Link exists aus. Wählen Sie den Typ: String equals. Geben Sie dann im Feld String den Wert ein, der dem Vorhandensein eines Backlinks entspricht: 1. Mit diesem Filter können Sie alle Ergebnisse ausgeben, bei denen ein Backlink vorhanden ist.

Fügen Sie einen Results Builder (Ergebnis-Builder) hinzu und wählen Sie in der Dropdown-Liste die Quelle: $p1.extlinks.$i.link - Link aus. Wählen Sie den Typ: Extract Top Domain. So erhalten wir die Domains aus den externen Links.

Beispiel für die Verwendung eines Filters und des Ergebnis-Builders
Beispiel herunterladen

Wie man ein Beispiel in A-Parser importiert

eJx9VNtuGjEQ/RVkIaWR6C4Qpar2jdAgpSIhJeSJ5MHZHcDBa29sLxch/r0z3hsp
bd88M2fO3H1gjtu1fTRgwVkWzQ8s828WsdsdTzMJrXgF8br1xuO1FGptW7AT1tnW
6G48u52yDsu4sWDIec6GhI2iGwSPEYzWBBY8l451DsztM0DehZAODJowEFkiVjCi
pjDNChx85FyicsNlTnIP3zpzQisULCjLjg2p3oAxIgHEiISCaJNyV0ZoONqwc76K
oAB8uWhXhbW+ttq+1Eoo68QXaV5e1MUlO76+VnnbkWcg0qwXlF2rjU98AzNdVAuN
eoTSA099Kgl3QNYqlcvA7YiBJ4mgKrksIlBnm6jPSnz4UpRGLD6NADsyOkWVA09A
yn2V3Zy1vcyQIve+vwofFi24tNBhFlMdcUwk+dMicBjcaTPxXUf9gWk1kHIMG5AN
zPPf5EImuAaDBTrdlY5/h0zOOI51eaehcKRbgznULF66mdw3Xoke62XVDClS4VC2
Q50rGkwXlWuArO7ZA8FSbaAO40wOdXA8gwwUrU8zsUHWqD5V8WkqJ8oDszo3MYab
dztzVi2czw8vghao3Fk0GR67mc5+6JQLRbM3hu8LU+XlaIu86xFdY60WYjkpt71K
IlczPOOJGmq6WOqYyqXEgVuYNos3sOWASaibeuY89CEwaH26mIOW9udT0YXMCEzp
mmpPcUanUUvKmEv5PB2fWlizrCisnMtsFIYLYVdrEShwYavSSVCOByYPFWxt2O/2
u2GvH/a+h5JvhOLhi6qQoIKtWIsMEsEDbZYhSeG9trHe/pOue010/aswFm5fkiHM
6jgG844jhL0NhPp/TsjQvSKelU5BgrUnWbl3HD8eL8HPCbhxIkYPIvkWdrGw6zAB
7laSv4WMWudgqfFccbA07/JzrT/ow9kXGx2OeAjv9rFA0mwJhzpcEut/y97xN4Qy
DUs=
Tipp

Der Ergebnis-Builder kann so oft hinzugefügt werden, wie Sie benötigen.

Siehe auch:

Mögliche Einstellungen

Unterstützt alle Einstellungen des Parsers HTML::LinkExtractorHTML::LinkExtractor sowie zusätzlich:

ParameternameStandardwertBeschreibung
Check robots.txtLegt fest, ob das Indexierungsverbot der Seite über die robots.txt geprüft werden soll
Match link by substringLegt fest, ob die Suche nach dem Link durch Übereinstimmung der Zeichenfolge erfolgen soll. Links können ohne Angabe des Schemas geprüft werden, z. B. nach Domain ohne Angabe des http-Protokolls