Ana içeriğe atla

SE::Google::TrustCheck - Site Güven (Trust) Kontrolü

Veri kazıyıcı incelemesi

Veri kazıyıcı, Google'daki site güvenini (trust) kontrol etmenizi sağlar. SE::GoogleSE::Google veri kazıyıcısının tüm özellikleri mevcuttur. A-Parser'ın çoklu iş parçacığı çalışması sayesinde, sorgu işleme hızı dakikada 900 sorguya ulaşabilir, bu da ortalama olarak dakikada 6200 sonuç almayı sağlar.

Veri kazıyıcı incelemesi: çalışma hızı

A-Parser'ın işlevselliği, veri çekme ayarlarını daha sonra kullanmak üzere kaydetmenize (presetler), veri çekme zamanlamasını ayarlamanıza ve çok daha fazlasına olanak tanır.

Sonuçların kaydedilmesi, sonuçlara ek mantık uygulamanıza ve verileri JSON, SQL ve CSV dahil olmak üzere çeşitli formatlarda çıktı almanıza olanak tanıyan yerleşik güçlü şablon oluşturucu Template Toolkit sayesinde ihtiyacınız olan biçimde ve yapıda mümkündür.

Toplanan veriler

  • Google'ın siteye olan Trust (güven) kontrolü
  • Olası sonuçlar - 0, 1 ve 2:
    • 0 - ek bağlantı blokları yok
    • 1 veya 2, Google'ın siteye güvendiği anlamına gelir, çünkü ek bağlantı blokları görüntüler. 1 - sitenin yatay bir bağlantı bloğuna sahip olduğu, 2 ise büyük bir dikey bağlantı bloğuna sahip olduğu anlamına gelir

SE::Google::TrustCheck veri kazıyıcısının topladığı veriler SE::Google::TrustCheck veri kazıyıcısının topladığı veriler

Özellikler

  • Güvenilir sitelerden oluşan bir veritabanı toplama
  • Arama ülkesi, alan adı, sonuç dili seçimi ve diğer ayarları destekler

Sorgular

Sorgu olarak aranan sitenin URL'sini belirtmeniz gerekir, örneğin:

http://uraldekor.ru/  
http://a-parser.com/
http://www.yandex.ru/
http://google.com/
http://vk.com/
http://facebook.com/
http://youtube.com/

Sorgu Değişimleri

Dosyalardan alt sorguları otomatik olarak yerleştirmek için yerleşik makroları kullanabilirsiniz, örneğin siteleri/siteyi bir anahtar kelime veritabanına göre kontrol etmek istiyorsak, birkaç ana sorgu belirtelim:

ria.ru
lenta.ru
rbc.ru
yandex.ru

Sorgu formatında, Keywords.txt dosyasından ek kelimeler yerleştirmek için makroyu belirtelim; bu yöntem, site veritabanını anahtar kelime veritabanına göre kontrol etmenize ve sonuç olarak pozisyonları almanıza olanak tanır:

$query {subs:Keywords}

Bu makro, her bir kaynak arama sorgusu için dosyada bulunan miktar kadar ek sorgu oluşturacaktır; bu da makro çalışması sonucunda toplamda [kaynak sorgu sayısı (alan adları)] x [Keywords dosyasındaki sorgu sayısı] = [toplam sorgu sayısı] verecektir.

Ayrıca sorgu formatında protokol belirtebilirsiniz, böylece sorgu olarak sadece alan adlarını kullanabilirsiniz:

http://$query 

Bu format, her sorgunun başına http:// ekleyecektir.

Sonuç çıktı seçenekleri

A-Parser, yerleşik şablon oluşturucu Template Toolkit sayesinde sonuçların esnek bir şekilde formatlanmasını destekler; bu da sonuçları rastgele bir formda ve ayrıca CSV veya JSON gibi yapılandırılmış bir biçimde sunmasına olanak tanır.

Güven kontrol listesi dışa aktarımı

Sonuç formatı:

$query: $trustrank\n

Sonuçta bağlantıların listesi ve Trust kontrolü görüntülenir.

Sonuç örneği:

http://www.yandex.ru/: 2
http://a-parser.com/: 1
http://vk.com/: 2
http://uraldekor.ru/: 0
http://google.com/: 2
...

SE::Google ile aynıdır.

SE::Google ile aynıdır.

SE::Google ile aynıdır.

Anahtar kelime rekabeti

SE::Google ile aynıdır.

Bağlantı indeksleme kontrolü

SE::Google ile aynıdır.

SQL formatında kaydetme

SE::Google ile aynıdır.

Sonuçların JSON formatında dökümü

SE::Google ile aynıdır.

Sonuçların işlenmesi

A-Parser, sonuçları doğrudan veri çekme sırasında işlemenize olanak tanır; bu bölümde SE::Google::TrustCheck veri kazıyıcı için en popüler durumları sunduk.

Trust değeri "1" olan alan adlarını kaydetme

Bir filtre ekleyin ve açılır listeden trust değişkenini seçin: $trustrank - Trust rank. Türü seçin: String equal. Ardından String (Satır) kısmına ihtiyacımız olan trust değerini yazın: 1. Bu filtre ile ihtiyacınız olmayan trust değerine sahip tüm sonuçları kaldırabilirsiniz.

Filtreleme örneği
Örneği indir

Örneği A-Parser nasıl içe aktaracağınız burada

eJx1VEtz2jAQ/iuMJod2hjhw6MU3woROOzSkCTkBB4HXRLWsNXrwGA//vSvZ2CYt
J3tf37f7raSSWW4y86LBgDUsXpSsCP8sZm9PcfwdcSshjufaGTv+gE3Wu+8FQ3OV
9VIhLWjWZwXXBrQHWNyoo6QEUu6kZf2S2VMBRIF70FokQEGRkJ2izrmlBkIa23Pp
fNrdzoE+xb07e2FeLhU738YpNB5PGqwWYDo4w8Fg0C1r2q8ZY9YQkLOKzqtU2Dku
u1D0j4UVqMgwoAw7r1YXIDMJc/jOi2FUC9oE3/ge5ljRQ+uekPXM8zBvwi34aFQJ
8uVrZI8egSeJ8JxcVgxe8Jb1XYldaE4h5XrNaPyJxtwPBgEgCHnpbsE+rC3ih4dK
X0ZILkD8rkpZnHJpoM8MdTzh1E/yOSJIIW5Rz4IU5C8ZqpGUU9iDbNMC/qMTMqFD
Mkqp6Edd+P+U2T8Y52bKLhWt/aCphwYlWI+zX21VglPckgDJmsaXIheWbDNGp/x+
BuTMAIpGumcvXY4aGpoauWanm1KA8mes3dyoaF1XY1xt59q5QZWK7aw+t5dMp+Z0
HWdqjHkhwc+lnJS0FgOv7SkZmXoN3mgb/Fw8DhR+9Mu9YxZRmp9vVauFFnQKv/kG
c1Kyy1pDbriU76/TboS1J4sMpznNlKGOtFsqfl89A9EG86U6HA7RiasEjiG4DS9C
Fdpn1TflG1gj1tYJnXXrkMI8t4Ut0qkkZc6r5oVpXqry1jsTl2da+x/zUhV4jXw6
+UhsEy7s8PwXfU7A2Q==
ipucu

Ayrıca bakınız: Sonuç filtreleri

SE::Google ile aynıdır.

SE::Google ile aynıdır.

Alan adlarını çıkarma

SE::Google ile aynıdır.

Çıpalardan ve snippet'lerden etiketleri kaldırma

SE::Google ile aynıdır.

SE::Google ile aynıdır.

Olası ayarlar

SE::GoogleSE::Google veri kazıyıcısının tüm ayarlarını ve ayrıca şunları destekler:
Parametre adıVarsayılan değerAçıklama
Pages count1Arama sonuçları sayfa sayısı (1 ile 10 arası)