Ana içeriğe atla

SE::Seznam - Çek arama motoru seznam.cz için Veri Kazıyıcı

Seznam

Seznam veri kazıyıcı incelemesi

Seznam arama sonuçları veri kazıyıcı. Seznam veri kazıyıcı sayesinde, daha sonraki kullanımlar için hazır büyük bağlantı veritabanları elde edebilirsiniz. Sorguları, arama operatörleri (site, inurl vb.) dahil olmak üzere Dogpile arama çubuğuna girdiğiniz şekilde kullanabilirsiniz.

A-Parser işlevselliği, Seznam veri kazıyıcı ayarlarını daha sonra kullanmak üzere kaydetmenize (ön tanımlı ayarlar), veri çekme planı oluşturmanıza ve çok daha fazlasına olanak tanır. Mümkün olan maksimum sonuç sayısını elde etmek için otomatik sorgu çoğaltma, dosyalardan alt sorgu yerleştirme, sayısal-harf kombinasyonlarını ve listeleri tarama özelliklerini kullanabilirsiniz.

Sonuçların kaydedilmesi, sonuçlara ek mantık uygulamanıza ve verileri JSON, SQL ve CSV dahil olmak üzere çeşitli formatlarda çıktı almanıza olanak tanıyan yerleşik güçlü şablon motoru Template Toolkit sayesinde ihtiyacınız olan biçimde ve yapıda mümkündür.

Toplanan veriler

  • Arama sonuçlarından bağlantılar, çapalar (anchor) ve snippet'ler
  • İlgili anahtar kelimelerin listesi (Related keywords)
Toplanan veriler

Özellikler

  • Seznam tarafından sunulan maksimum sonuç sayısını çeker - arama sonuçlarında 20 öğelik 50 sayfa
  • Sorgu başına toplam maksimum sonuç sayısı - 1000

Kullanım senaryoları

  • Bağlantı veritabanlarının toplanması - A-Poster, XRumer, AllSubmitter vb. için.
  • Sitelerin geri bağlantılarının (backlink/bahsedilmelerin) aranması
  • Savunmasız sitelerin aranması
  • Seznam veri çekme işlemini şu veya bu şekilde içeren diğer tüm seçenekler

Sorgular

Sorgu olarak, doğrudan Seznam arama formuna giriliyormuş gibi arama ifadeleri belirtilmelidir, örneğin:

test query
pencereler İstanbul
site:a-parser.com
inurl:auto

Sorgu değişimleri

Sorguları çoğaltmak için yerleşik makroları kullanabilirsiniz, örneğin çok büyük bir forum veritabanı elde etmek istiyorsak, farklı dillerde birkaç ana sorgu belirtelim:

forum
forum
foro
论坛

Sorgu formatında a'dan zzzz'ye kadar karakter taramasını belirtelim; bu yöntem arama sonuçlarını maksimum düzeyde döndürmeye ve birçok yeni benzersiz sonuç elde etmeye olanak tanır:

$query {az:a:zzzz}

Bu makro, her bir kaynak arama sorgusu için 475254 ek sorgu oluşturacaktır; bu da toplamda 4 x 475254 = 1901016 arama sorgusu eder. Bu rakam etkileyici olsa da A-Parser için hiç sorun değildir. Dakikada 2000 sorgu hızıyla bu görev sadece 16 saatte tamamlanacaktır.

Operatörlerin kullanımı

Sorgu formatında arama operatörlerini kullanabilirsiniz, böylece listenizdeki her sorguya otomatik olarak eklenecektir:

site:$query

Sonuç çıktı seçenekleri

A-Parser, yerleşik Template Toolkit şablon motoru sayesinde sonuçların esnek bir şekilde biçimlendirilmesini destekler; bu da sonuçları rastgele bir formda veya CSV ya da JSON gibi yapılandırılmış bir biçimde çıktı almanıza olanak tanır.

Bağlantı listesi dışa aktarma

SE::Google ile aynıdır.

SE::Google ile aynıdır.

SE::Google ile aynıdır.

SQL formatında kaydetme

SE::Google ile aynıdır.

Sonuçların JSON formatında dökümü

SE::Google ile aynıdır.

Sonuçların işlenmesi

A-Parser, sonuçları doğrudan veri çekme sırasında işlemenize olanak tanır; bu bölümde Seznam veri kazıyıcı için en popüler durumları bir araya getirdik.

SE::Google ile aynıdır.

SE::Google ile aynıdır.

Alan adlarını ayıklama

SE::Google ile aynıdır.

Çapalardan ve snippet'lerden etiketleri kaldırma

SE::Google ile aynıdır.

SE::Google ile aynıdır.

Olası ayarlar

Parametre adıVarsayılan değerAçıklama
Pages count5Veri çekilecek sayfa sayısı (1'den 50'ye kadar)
Links per page10Bir sayfadaki bağlantı sayısı (10 / 20)