Sıkça Sorulan Sorular
1. Demo, ödeme ve satın alma ile ilgili sorular
1.1. Demo sürümünde sonuçlar nasıl indirilir?
Demo sürümünde çalışma sonuçları indirmeye açık değildir. Bunları talepleriniz üzerine sağlıyoruz. Taleplerinizi gönderin ve hangi veri kazıyıcı ile ilgilendiğinizi belirtin, biz de size sonuçları gönderelim (demo kapsamında sayıları sınırlıdır).
1.2. A-Parser satın aldıktan sonra bir şey için ek ödeme yapmam gerekiyor mu?
Hayır. Daha detaylı bilgi için: lisanslar ve eklentiler, satın alma sayfası.
1.3. Proxy ödemesi nerede ve nasıl yapılabilir?
Lisans satın aldığınızda size bonus proxyler sağlanır.
Lite - 2 hafta boyunca 20 iş parçacığı, Pro ve Enterprise - bir ay boyunca 50 iş parçacığı.
Daha fazla iş parçacığı satın alabilir veya süreyi Üye Paneli Mağaza sekmesi, Proxy alt bölümünden uzatabilirsiniz.
1.4. Ücret karşılığında bana görev ayarlayabilir misiniz?
A-Parser'ın çalışmasıyla ilgili konularda teknik destek ücretsiz olarak sağlanmaktadır. Ücretli görev hazırlama yardımı için buraya başvurabilirsiniz: Görev hazırlama, kurulum yardımı ve A-Parser eğitimi için ücretli hizmetler.
1.5. Veri kazıyıcı için Privat24 bankası veya KIWI üzerinden ödeme yapabilir miyim?
Çalıştığımız ödeme sistemlerinin listesi burada belirtilmiştir: A-Parser satın al.
1.6. Sadece Yandex'teki indekslenmiş sayfa sayısını çekmem gerekiyorsa hangi veri kazıyıcıyı almalıyım?
Bu tür amaçlar için Lite sürümü yeterlidir, ancak Pro sürümü çalışma açısından daha pratik ve esnektir.
1.7. Lisans bilgilerimi nerede görebilirim?
1.8. Satın alınan proxyleri birden fazla IP ile kullanmak mümkün mü?
Hayır.
2. Kurulum, başlatma ve güncellemeler hakkında sorular
2.1. Download butonuna basıyorum ama arşiv inmiyor. Ne yapmalıyım?
Sabit diskinizde boş alan olup olmadığını kontrol edin, antivirüsü devre dışı bırakın. Kurulum talimatlarını izleyin. Ayrıca Nasıl başlanır bölümüne göz atın.
2.2. Enterprise sürümü satın aldım ama hala PRO kuruluyor. Ne yapmalıyım?
Önceki sürümü silin. Members Area'da IP adresinizin doğru tanımlanıp tanımlanmadığını kontrol edin. Yüklemeden önce Update (Güncelle) butonuna basın. Daha yeni sürümü indirin. Daha fazla detay kurulum talimatlarında.
2.3. Programı kurdum ama açılmıyor, ne yapmalıyım?
Çalışan uygulamaları kontrol edin, antivirüsü devre dışı bırakın, kullanılabilir boş RAM miktarını kontrol edin. Ayrıca Üye Paneli üzerinden IP adresinizin doğru tanımlanıp tanımlanmadığını kontrol edin. Daha fazla detay: kurulum talimatları.
2.4. Dinamik IP adresim varsa ne yapmalıyım?
Sorun değil, A-Parser dinamik IP adreslerini destekler. Sadece her değiştiğinde Members Area'da tanımlamanız gerekir. Bu işlemlerden kaçınmak için statik bir IP adresi kullanılması önerilir.
2.5. Veri kazıyıcı kurulumu için en uygun sunucu veya bilgisayar parametreleri nelerdir?
Tüm sistem gereksinimlerine buradan bakabilirsiniz: sistem gereksinimleri.
2.6. Görevi başlattım. Veri kazıyıcı çöktü ve bir daha açılmıyor, ne yapmalıyım?
Sunucuyu durdurmanız, bellekte asılı kalan bir işlem olup olmadığını kontrol etmeniz ve tekrar başlatmayı denemeniz gerekir. Ayrıca A-Parser'ı tüm görevleri durdurarak başlatmayı deneyebilirsiniz. Bunun için -stoptasks parametresi ile çalıştırmanız gerekir. Parametre ile başlatma hakkında detaylar.
2.7. 127.0.0.1:9091 adresini açarken hangi şifreyi girmeliyim?
Eğer bu ilk başlatma ise şifre boştur. İlk değilse, belirlediğiniz şifredir. Şifrenizi unuttuysanız - şifre sıfırlama.
2.8. Üye Paneli'nde IP'mi giriyorum ama Mevcut IP'niz alanında değişmiyor. Neden?
Your current IP (Mevcut IP'niz) alanı şu anda geçerli olan IP'nizi gösterir ve değişmemelidir. Bu IP'yi IP 1 alanına yazmalısınız.
2.9. Aynı anda iki kopya çalıştırabilir miyim?
Aynı makinede iki kopya çalıştırmak, ancak yapılandırma dosyasında farklı portlar tanımlanmışsa mümkündür.
İki A-Parser'ı farklı makinelerde aynı anda çalıştırmak, ancak Üye Paneli üzerinden ek bir IP satın aldıysanız mümkündür.
2.10. Veri kazayıcının donanım kilidi (HWID) var mı?
Hayır. Lisans kontrolü için IP adresiniz kullanılır.
2.11. Güncelleme hakkında soru - sadece .exe mi güncellenmeli? config/config.db ve files/Rank-CMS/apps.json - bu dosyalar ne işe yarar?
Aksi belirtilmedikçe sadece .exe dosyasını güncelleyin. İlk dosya A-Parser yapılandırmasını saklamak içindir, ikincisi ise CMS belirleme veritabanı ve
Rank::CMS veri kazıyıcısının çalışması içindir.
2.12. Win Server 2008 Web Edition kullanıyorum - veri kazıyıcı açılmıyor...
Bu işletim sistemi sürümünde A-Parser çalışmayacaktır. Tek seçenek işletim sistemini değiştirmektir.
2.13. 4 çekirdekli işlemcim var. A-Parser neden sadece tek çekirdek kullanıyor?
A-Parser 2 ila 4 çekirdek kullanır, ek çekirdekler yalnızca filtreleme, Sonuç Oluşturucu ve Parse custom result işlemlerinde kullanılır.
2.14. Segmentasyon hatası (segmentation failed, segmentation error) almaya başladım. Ne yapmalıyım?
Büyük olasılıkla IP adresiniz değişti. Üye Paneli üzerinden kontrol edin.
2.15. Linux kullanıyorum. A-Parser başladı ama tarayıcıda açılmıyor. Nasıl çözülür?
Güvenlik duvarını kontrol edin - büyük olasılıkla erişimi engelliyordur.
2.16. Windows 7 kullanıyorum. A-Parser başladı ama tarayıcıda açılmıyor ve görev yöneticisinde Node.js işlemi yok. Nasıl çözülür?
Windows güncellemelerini kontrol etmeniz ve mevcut en son güncellemeleri yüklemeniz gerekir. Özellikle Windows 7 SP1 güncellemesi gereklidir.
2.17. A-Parser başlamıyor ve aparser.log dosyasında FATAL: padding_depad failed: Invalid argument provided. at ./Crypt/Mode/CBC.pm line 20 hatası yazıyor.
Büyük olasılıkla bir görevle ilgili sorun oluşuyor (/config/tasks/ klasörü), bir disk hatası sonucunda (örneğin bilgisayarın gücü düzgün kapatılmadan kesildiyse), daha fazla bilgiyi A-Parser'ı -morelogs bayrağıyla çalıştırarak öğrenebilirsiniz.
Çözüm: A-Parser'ı -stoptasks parametresiyle başlatın. Eğer yardımcı olmazsa, tüm /config/tasks/ içeriğini temizleyin. Eğer bundan sonra da sorun çözülmezse, veri kazıyıcıyı yeni bir dizine yeniden kurun ve eskisinin yapılandırmasını (eğer hasar görmemişse) içine atın.
3. A-Parser yapılandırması ve diğer ayarlar hakkında sorular
3.1. Proxy denetleyici nasıl ayarlanır?
Detaylı talimat burada bulunmaktadır: proxy ayarları.
3.2. Çalışan proxy yok - neden?
İnternet bağlantınızı ve proxy denetleyici ayarlarınızın doğruluğunu kontrol edin. Her şey doğru yapılmışsa, bu şu anda proxy listenizin çalışan sunucular içermediği anlamına gelir. Bu sorunun çözümü: ya başka proxyler kullanmak ya da daha sonra tekrar denemektir. Eğer bizim proxylerimizi kullanıyorsanız, Üye Paneli Proxies (Proxy) bölümündeki IP adresini kontrol edin. Ayrıca sağlayıcınızın diğer DNS'lere erişimi engelliyor olması ihtimali de vardır, burada açıklanan adımları denemeyi deneyin: http://a-parser.com/threads/1240/#post-3582
3.3. Antigate nasıl bağlanır?
3.4. Veri kazıyıcı ayarlarındaki parametreleri değiştirdim ama uygulanmadı. Neden?
Varsayılan (default) ön ayar değiştirilemez, herhangi bir değişiklik yapıldıysa Save as New Preset (Yeni ön ayar olarak kaydet) butonuna basmanız ve ardından görevinizde bunu kullanmanız gerekir.
3.5. Çalışan bir görevin ayarları değiştirilebilir mi?
Mümkündür, ancak hepsi değil. Çalışan bir görevde duraklatma butonuna basabilir ve aynı açılır menüden Edit (Düzenle) seçeneğini seçebilirsiniz.
3.6. Ön ayar (preset) nasıl içe aktarılır?
Görev Düzenleyici'de görev seçim alanının yanındaki butona basın. Detaylar burada.
3.7. Veri kazıyıcıyı proxy kullanmayacak şekilde nasıl ayarlarım?
İlgili veri kazıyıcının ayarlarında Use proxy onay kutusunun işaretini kaldırın.
3.8. Bende Geçersiz kılma ekle / Override option butonu yok!
Bu seçenek doğrudan Görev Düzenleyici'ye eklenebilir. Veri kazıyıcı seçenekleri.
3.9. Aynı sonuç dosyasına nasıl yeniden yazılır?
Görevi oluştururken Overwrite file (Dosyanın üzerine yaz) seçeneğini ayarlayın.
3.10. Veri kazayıcı şifresi nereden değiştirilir?
3.11. 6 milyon anahtar kelimeyi veri çekmeye koydum ve alan adlarının benzersiz olmasını sağladım. Yeni 6 milyon anahtar kelime koyduğumda, sadece önceki çekimle çakışmayan benzersiz alan adlarının kaydedilmesini nasıl sağlarım?
İlk görevi oluştururken Keep unique (Deduplikasyon kaydı) seçeneğini kullanmanız ve ikinci görevde kaydedilen veritabanını belirtmeniz gerekir. Görev düzenleyici ek seçeneklerinde detaylar.
3.12. Google için 1000 sonuç sınırını nasıl aşarım?
Tüm sonuçları çek / Parse all results seçeneğini kullanın.
3.13. Linux'ta 1024 iş parçacığı sınırını nasıl aşarım?
3.14. Windows'ta iş parçacığı sınırı nedir?
10000 iş parçacığına kadar.
3.15. Sorguları nasıl benzersiz yaparım?
Unique queries (Görev Düzenleyici)'deki Queries (Sorgular) bloğunda Benzersiz sorgular seçeneğini kullanın.

3.16. Proxy kontrolü nasıl kapatılır?
Ayarlar - Proxy Denetleyici Ayarları'ndan ilgili denetleyiciyi seçin ve No check proxies (Proxyleri kontrol etme) kutusunu işaretleyin. Kaydedin ve kaydedilen ön ayarı seçin.
3.17. Proxy ban time nedir? 0 yapabilir miyim?
Proxy'nin saniye cinsinden ban süresidir. Evet, 0 yapabilirsiniz.
3.18.
SE::Google::Position veri kazıyıcısında Exact Domain ve Top Level Domain arasındaki fark nedir?
Exact Domain tam eşleşmedir, yani sonuçlarda www.domain.com varsa ve biz domain.com arıyorsak eşleşme olmayacaktır. Top Level Domain tüm üst düzey alan adını kontrol eder, yani burada eşleşme olacaktır.
3.19. Test çekimi yapınca her şey çalışıyor, normal çekimde Some error hatası alıyorum.
Büyük olasılıkla sorun DNS'tedir, bu DNS ayar talimatını uygulamayı deneyin.
3.20. Sonuç Formatı nerede belirlenir?
Sonuç biçimlendirme sırasında \n kullanın. Örnek:
3.21. Google ayarlarında olmasına rağmen
SE::Google veri kazıyıcısında Hollandaca dili neden yok?
Hollandaca dili listede Dutch olarak mevcuttur. Detaylar Hollandaca dilinin eklenmesiyle ilgili iyileştirmede.
4. Veri çekme ve veri çekme sırasındaki hatalar hakkında sorular
4.1. İş parçacıkları (threads) nedir?
Tüm modern işlemciler görevleri birden fazla iş parçacığında yürütebilir, bu da yürütme hızını önemli ölçüde artırır. Karşılaştırma için, birim zamanda belirli sayıda insan taşıyan normal bir otobüs örneği verilebilir - bu normal, tek iş parçacıklı işleme olacaktır; aynı sürede iki kat daha fazla insan taşıyan iki katlı bir otobüs ise çoklu iş parçacığı ile işleme olacaktır. A-Parser aynı anda 10000 iş parçacığına kadar işlem yapabilir.
4.2. Görev başlamıyor - Some Error yazıyor - neden?
IP adresini Üye Paneli üzerinden kontrol edin.
4.3. Tüm sorgular başarısıza düşüyor, ne yapmalıyım?
Büyük olasılıkla görev yanlış yapılandırılmış veya geçersiz bir sorgu formatı kullanılıyor. Ayrıca canlı proxylerin olup olmadığını kontrol edin. Ayrıca Request retries seçeneğini artırmayı deneyebilirsiniz (detaylar burada: başarısız istekler).
4.4.
SE::Yandex::Wordstat ile 1.000.000 anahtar kelime çekmek için kaç hesap kaydetmek gerekir?
Kaç hesap gerektiğini tam olarak söylemek mümkün değildir, çünkü bir hesap bilinmeyen sayıda sorgudan sonra kullanılamaz hale gelebilir. Ancak
SE::Yandex::Register veri kazıyıcısını kullanarak her zaman yeni hesaplar kaydedebilir veya mevcut hesapları files/SE-Yandex/accounts.txt dosyasına ekleyebilirsiniz.
4.5. Görev başlamıyor, Error: Lock 100 threads failed(20 of limit 100 used) yazıyor, ne yapmalıyım?
Veri kazıyıcı ayarlarında maksimum kullanılabilir iş parçacığı sayısını artırmanız veya görev ayarlarında düşürmeniz gerekir. Detaylar Ayarlar bölümünde.
4.6. Aynı anda 2 görev çalıştırılabilir mi?
Evet, A-Parser aynı anda birden fazla görevin yürütülmesini destekler. Aynı anda çalışan görev sayısı Ayarlar - Genel Ayarlar: Maksimum aktif görev kısmından düzenlenir.
4.7. Sonuç dosyası nerede bulunur?
Tasks Queue (Görev Kuyruğu) sekmesinde, her görev bittikten sonra çalışma sonuçlarını indirebilirsiniz. Fiziksel olarak results klasöründe bulunurlar.
4.8. Veri çekme bitmeden sonuç dosyası indirilebilir mi?
Hayır, veri çekme işlemi bitene kadar sonuçlar indirilemez. Ancak görev durdurulduğunda veya duraklatıldığında aparser/results klasöründen kopyalanabilir.
4.9. Veri kazayıcınızla tek bir sorgu için 1.000.000 bağlantı çekilebilir mi?
Evet, Tüm sonuçları çek / Parse all results seçeneğini kullanarak.
4.10.
Rank::CMS,
Net::Whois proxy olmadan kullanılabilir mi?
Rank::CMS - kullanılabilir ve hatta kullanılmalıdır.
Net::Whois - önerilmez.4.11. Google'dan bağlantılar nasıl çekilir?
SE::Google kullanılması gerekmektedir.4.12. Veri kazıyıcı bağlantılar arasında gezinebilir mi?
Evet, bu işlem Seviyeye kadar çek / Parse to level seçeneği kullanıldığında
HTML::LinkExtractor veri kazıyıcısı tarafından yapılabilir.
4.13. Google çok yavaş veri çekiyor, ne yapmalıyım?
Öncelikle görev günlüklerine bakmanız gerekir, belki de tüm istekler başarısızdır. Eğer öyleyse, isteklerin neden başarısız olduğunu bulup düzeltmeniz gerekir.
SE::Google ile veri çekme sırasında, günlüklerdeki başarısız denemeler genellikle Google'ın captcha göstermesiyle ilgilidir, bu normaldir. Veri kazıyıcının denemeleri tekrarlamaması için captcha'ları aşmak üzere Antigate bağlayabilirsiniz.
Ayrıca, veri çekme hızını etkileyen faktörlerin ve bunların nasıl etkilediğinin açıklandığı bir makale bulunmaktadır: veri kazıyıcıların hızı ve çalışma prensibi.
4.14. Veri kazayıcınızla sadece Japonca metin içeren bağlantılar çekilebilir mi?
Evet, bunun için veri kazıyıcı ayarlarında gerekli dili ayarlamanız ve Japonca anahtar kelimeler kullanmanız gerekir.
4.15. Veri kazayıcınızla sadece .de veya .ru alan adı uzantısındaki bağlantılar çekilebilir mi?
Evet. Bunun için bir filtre kullanmanız gerekir.
4.16. Dosyadaki her sonucun yeni satırda olması nasıl sağlanır?
Sonuç formatlama sırasında \n kullanın. Örnek:
$serp.format('$link\n')
4.17. Google'dan ilk 10 site nasıl çekilir?
İşte ön ayar:
eyJwcmVzZXQiOiJUT1AxMCIsInZhbHVlIjp7InByZXNldCI6IlRPUDEwIiwicGFy
c2VycyI6W1siU0U6Okdvb2dsZSIsImRlZmF1bHQiLHsidHlwZSI6Im92ZXJyaWRl
IiwiaWQiOiJwYWdlY291bnQiLCJ2YWx1ZSI6MX0seyJ0eXBlIjoib3ZlcnJpZGUi
LCJpZCI6ImxpbmtzcGVycGFnZSIsInZhbHVlIjoxMH0seyJ0eXBlIjoib3ZlcnJp
ZGUiLCJpZCI6InVzZXByb3h5IiwidmFsdWUiOmZhbHNlfV1dLCJyZXN1bHRzRm9y
bWF0IjoiJHAxLnByZXNldCIsInJlc3VsdHNTYXZlVG8iOiJmaWxlIiwicmVzdWx0
c0ZpbGVOYW1lIjoiJGRhdGVmaWxlLmZvcm1hdCgpLnR4dCIsImFkZGl0aW9uYWxG
b3JtYXRzIjpbXSwicmVzdWx0c1VuaXF1ZSI6Im5vIiwicXVlcnlGb3JtYXQiOlsi
JHF1ZXJ5Il0sInVuaXF1ZVF1ZXJpZXMiOmZhbHNlLCJzYXZlRmFpbGVkUXVlcmll
cyI6ZmFsc2UsIml0ZXJhdG9yT3B0aW9ucyI6eyJvbkFsbExldmVscyI6ZmFsc2Us
InF1ZXJ5QnVpbGRlcnNBZnRlckl0ZXJhdG9yIjpmYWxzZX0sInJlc3VsdHNPcHRp
b25zIjp7Im92ZXJ3cml0ZSI6ZmFsc2V9LCJkb0xvZyI6Im5vIiwia2VlcFVuaXF1
ZSI6Ik5vIiwibW9yZU9wdGlvbnMiOmZhbHNlLCJyZXN1bHRzUHJlcGVuZCI6IiIs
InJlc3VsdHNBcHBlbmQiOiIiLCJxdWVyeUJ1aWxkZXJzIjpbXSwicmVzdWx0c0J1
aWxkZXJzIjpbXSwiY29uZmlnT3ZlcnJpZGVzIjpbXX19
4.18. Görev ekliyorum, Görev Kuyruğu sekmesine geçiyorum ama orada yok! Neden?
Ya görev oluşturulurken bir hata yapılmıştır ya da görev zaten tamamlanmış ve Completed (Tamamlananlar) kısmına geçmiştir.
4.19. Dosyanın utf-8 olmadığını yazıyor ama ben değiştirmedim, zaten utf-8, ne yapmalıyım?
Tekrar kontrol edin. Ayrıca, örneğin Notepad++ kullanarak kodlamayı değiştirmeyi deneyin.
4.20. Sonuç dosyasında her şey tek satırda, oysa görevde satır sonu koymuştum - neden?
A-Parser ek ayarlarında CRLF (Windows) satır sonu kullanılmalıdır.
Ancak bu seçenek olmadan zaten veri çektiyseniz, görüntülemek için Notepad++ gibi daha gelişmiş bir görüntüleyici kullanın.
4.21. Yandex üzerinden 1.000 sorgu için sorgu sıklığı kontrolü ne kadar sürer?
Bu gösterge görev parametrelerine, sunucu özelliklerine, proxy kalitesine vb. çok bağlıdır, bu nedenle kesin bir cevap vermek mümkün değildir.
4.22. Veri kazayıcıyı sonuçta sorgu-bağlantı olacak şekilde nasıl ayarlarım?
Sonuç formatı:
$p1.serp.format('$query: $link\n')
Sonuç şu şekilde olacaktır:
sorgu: bağlantı 1
sorgu: bağlantı 2
sorgu: bağlantı 3
4.23. Başarısız sorguları nasıl tekrar çekerim ve nerede saklanırlar?
Başarısız isteklerin kaydedilmesi için Queries (Görev Düzenleyici)'deki Sorgular bloğunda ilgili seçenek seçilmelidir. Başarısız sorgular queries\failed klasöründe saklanır. Yeni bir görev oluşturmalı ve sorgu dosyası olarak başarısız sorguların olduğu dosyayı belirtmelisiniz.
4.24. Metin çekerken HTML etiketlerinden nasıl kurtulurum?
Sonuç Oluşturucu içindeki Remove HTML tags seçeneğini kullanın.
4.25. Sadece alan adlarının çekilmesini nasıl sağlarım?
Sonuç Oluşturucu içindeki Extract Domain seçeneğini kullanın.
4.26. Veri kazayıcıda kullanılabilecek maksimum sorgu dosyası boyutu nedir?
Sorgu ve sonuç dosyalarının boyutları sınırlı değildir ve terabayt değerlerine ulaşabilir.
4.27. Sorgu alanına metin girdiğimde veri kazıyıcı neden Queries length limited to 8192 characters hatası veriyor?
Bu durum, sorgu uzunluğunun 8192 karakterle sınırlı olmasından kaynaklanır. Daha uzun sorgular kullanmak için sorgu olarak dosyaları kullanın.
4.28. Bekleyen iş parçacıkları - 3 ne anlama geliyor?
Bu, proxy yetersiz olduğu anlamına gelir. İş parçacığı sayısını azaltın veya proxy sayısını artırın.
4.29. Test çekiminde 596 SOCKS proxy error: Hello read error(Connection reset by peer) (0 KB) yazıyor ve çekmiyor, neden?
Bu, çalışmayan proxylere işaret eder.
4.30. Google veri kazayıcısında sonuç dili ile arama ülkesi arasındaki fark nedir?
Fark şu şekildedir: arama ülkesi, sonuçların belirli bir ülkeyle ilişkilendirilmesidir. Örneğin, belirli bir ülke için pencere satın almak arıyorsanız, öncelik o ülkede tam olarak pencere satın almayı teklif eden sitelere verilecektir. Sonuçların dili ise sonuçların hangi dilde sunulması gerektiğidir.
4.31. Belirli bir siteyi çekemiyorum. Sorun ne olabilir?
Genellikle sorun, sunucu tarafındaki eski user-agent nedeniyle engelleme oluşmasıdır. Yeni bir user-agent ile veya User agent parametresindeki şu kodla çözülür:
[% tools.ua.random() %]
4.32. Veri kazıyıcı donuyor, kapanıyor. Logda syswrite: No space left on device satırı var
A-Parser'ın sabit diskinde yeterli yer yok. Daha fazla yer açın.
4.33. Veri kazayıcım sonuçlarda none (veya açıkça yanlış sonuç) vermeye başladı
4.34. Sürekli Failed fetch news yazılı bir pencere çıkıyor
4.35. Arama sonuçlarından ilk n sonuç nasıl alınır?
4.36. Yönlendirme zinciri nasıl izlenir?
4.37. Kaynak sitedeki bağlantının indekslenip indekslenmediği nasıl kontrol edilir?
Bu tür amaçlar için ayrı bir veri kazıyıcı mevcuttur:
Check::BackLink.
Tartışmada daha fazla detay.
4.38. Veri kazıyıcı Linux'ta kapanıyor. Logda şu kayıt var: EV: error in callback (ignoring): syswrite() on closed filehandle at AnyEvent/Handle.pm line...
Büyük olasılıkla, Dokümantasyon: Daha fazla iş parçacığı için Linux ayarı bölümünde yazıldığı gibi iş parçacığı sayısını optimize etmeniz gerekir.
4.39. API üzerinden kullanılabilecek tüm olası parametreleri nerede görebilirim?
Ayrıca, JSON formatında tam bir görev yapılandırması oluşturulabilir. Bunun için görev kodunu alıp base64'ten çözmeniz gerekir.
4.40.
Net::HTTP ile resim indiriyorum ama neden hepsi bozuk çıkıyor? Ne yapmalıyım?
1) Max body size parametresini kontrol edin - belki artırmanız gerekebilir. 2) A-Parser ayarlarında satır sonu formatını kontrol edin: Ek ayarlar - Satır sonu.
Resmin bozuk olmaması için UNIX formatı kullanılmalıdır.
4.41. WHOIS'ten admin contact nasıl alınır?
Böyle bir görev, Parse custom result fonksiyonu ve düzenli ifade (regex) yardımıyla kolayca çözülür. Detaylar tartışmada.
4.42. Telefon numaralarını çekmek için düzenli ifade
4.43. Mobil sürümü olmayan sitelerin belirlenmesi
4.44. NS sunucu adı nasıl öğrenilir?
4.45. Yandex önbellek bağlantıları nasıl çekilir?
4.46. Sitenin tüm sayfalarının bağlantıları nasıl çekilir?
4.47. Sayfadan title nasıl çekilir?
4.48. Belirli bir alan adı uzantısındaki tüm siteler nasıl çekilir?
4.49. Parametreli tüm URL'ler nasıl toplanır?
4.50. Sonuçlar birkaç özelliğe göre nasıl filtrelenir ve raporda bunlara göre nasıl ayrılır?
4.51. Filtre yapısı nasıl basitleştirilir?
4.52. Sonuca göre dosyalara nasıl sıralanır?
4.53. Her X sayıda dosyada bir yeni sonuç dizini oluştur
4.54. WordStat ile çalışmaya ilk adımlar
4.55. 1000 karakterden büyük metin bloklarının toplanması
4.56. Sayfadan belirli miktarda metin çıktısı alma
Bu da Template Toolkit yardımıyla çözülür. Tartışmada daha fazla detay.
4.57. Google'da rekabet ve başlıkta geçme kontrolü
4.58. Sorgunun anchor ve snippet içinde geçme sayısına göre filtreleme
4.59. Makale içeriği tek satırda nasıl alınır?
4.60. İki dize tarihi nasıl karşılaştırılır?
4.61. Snippet'teki vurgulanan kelimeler nasıl çekilir?
4.62. Birden fazla veri kazıyıcı kullanan görev örneği
4.63. Sonuçtaki satırlar nasıl karıştırılır ve rastgele sayıda sonuç nasıl yazdırılır?
4.64. Sonuç MD5 ile nasıl imzalanır?
4.65. Tarih Unix timestamp'ten dize temsiline nasıl dönüştürülür?
4.66. Parse to level, kısıtlama ile nasıl veri çekilir?
4.67. Veri kazıyıcı Linux'ta görevi başlatırken kapanıyor. Logda şu satırlar var: Can't call method "if_list" on an undefined value at IO/Interface/Simple.pm...
Konsolda şu komutu çalıştırmanız gerekir:
apt-get --reinstall --purge install netbase
4.68. Hata Cannot init Parser: Error: Failed to launch the browser process! [0429/082706.472999:ERROR:zygote_host_impl_linux.cc(90)] Running as root without --no-sandbox is not supported...
A-Parser'ı root olmayan bir kullanıcıyla çalıştırmanız gerekir. Şöyle ki: root kullanıcısından root yetkisi olmayan yeni bir kullanıcı oluşturun (eğer varsa onu kullanın) ve ardından bu kullanıcının A-Parser dizini ile etkileşime girmesine izin verin, sonra yeni kullanıcıyla giriş yapın ve programı onun üzerinden başlatın.
root kullanıcısı altında bir kullanıcı oluşturun, bu kılavuzu kullanabilirsiniz.
Oluşturulan kullanıcının A-Parser dizini ile etkileşime girmesine izin vermek için kullanıcıya yetki vermeniz gerekir. Bunun için root kullanıcısı ile giriş yapın ve şu komutla yetki verin:
chown -R user:user aparser
4.69. Hata Cannot init Parser: Error: Failed to launch the browser process! [0429/102002.619437:FATAL:zygote_host_impl_linux.cc(117)] No usable sandbox! Update your kernel or see...
root kullanıcısı altında şu komutu çalıştırın:
sysctl -w kernel.unprivileged_userns_clone=1
A-Parser'ın yeniden başlatılması gerekmez.
CentOS 7 için çözüm bu konuda.
root kullanıcısı altında şu komutu çalıştırın:
echo "user.max_user_namespaces=15000" >> /etc/sysctl.conf
Ardından sysctl'yi şu komutla yeniden başlatın:
sysctl -p
4.70. Hata JavaScript execution error(): Error: Failed to launch the browser process! /aparser/dist/nodejs/node_modules/puppeteer/.local-chromium/linux-884014/chrome-linux/chrome: error while loading shared libraries: libatk-1.0.so.0: cannot open shared object file: No such file or directory...
Hata, Chrome'un çalışması için işletim sisteminde gerekli kütüphanelerin eksik olmasından kaynaklanmaktadır.
Chrome'un çalışması için gereken kütüphanelerin listesi Chrome headless doesn't launch on UNIX sayfasında bulunabilir.
4.71. Captcha neden çözülmüyor? Logda Xevil'den A-Parser'ın captcha cevabı yerine soru işaretleri aldığı görülüyor
Bölge ayarlarında Rusça ile değiştirmeniz gerekir.
Sadece gelişmiş sekmesinde değiştirmeniz gerekir. Bu captcha çözmeyi etkilemez, ancak her iki yerde de değiştirirseniz Xrumer'ın kendisinde kodlama sorunu olacaktır.
