Ana içeriğe atla

SE::Yandex::Speller - Yandex.Speller Aracılığıyla Metin Hatalarını Kontrol Etme

Veri Kazıyıcı Genel Bakış

SE::Yandex::Speller

SE::Yandex::SpellerSE::Yandex::Speller – Yandex.Speller servisi aracılığıyla belirtilen sayfadaki Rusça, Ukraynaca veya İngilizce metinlerdeki yazım hatalarını bulur. Dil modelleri yüz milyonlarca kelime ve kelime öbeği içerir.

A-Parser işlevselliği, SE::Yandex::Speller veri kazıyıcı ayarlarını daha sonra kullanmak üzere kaydetmenize (presetler), veri çekme zamanlaması oluşturmanıza ve çok daha fazlasına olanak tanır.

Sonuçların kaydedilmesi, sonuçlara ek mantık uygulamanıza ve verileri JSON, SQL ve CSV dahil olmak üzere çeşitli formatlarda çıktı almanıza olanak tanıyan yerleşik güçlü şablon oluşturucu Template Toolkit sayesinde ihtiyacınız olan biçimde ve yapıda mümkündür.

Toplanan Veriler

  • Hata bulunan metin blokları

Özellikler

  • Hata içeren blok sayısının belirlenmesi
  • Metindeki olası hata nedenlerinin çıktısı

Kullanım Durumları

  • Hata içeren metin bloklarının sayısını bulma
  • Web sitesi sayfalarındaki metinlerin yazım hataları için kontrol edilmesi
  • Web sitesi sayfalarında imla denetimi yapılması

Sorgular

Veri kazıyıcı, giriş olarak hem anahtar kelimeleri (metin dizeleri) hem de sayfa bağlantılarını kabul edebilir. Sorgu türü otomatik olarak belirlenir.

  • Metin dizeleri şeklinde sorgu örneği:
Yandex Speller veri kazıyıcı ile kontrol edilecek metin
Hatalı sorgu
  • Kontrol edilmesi gereken web sitesi sayfa adresi şeklinde sorgu örneği:
https://a-parser.com/
https://en.wikipedia.org/wiki/Parsing

Sonuç Çıktı Seçenekleri

A-Parser, yerleşik şablon oluşturucu Template Toolkit sayesinde sonuçların esnek bir şekilde formatlanmasını destekler; bu da sonuçları rastgele bir formda ve ayrıca CSV veya JSON gibi yapılandırılmış bir biçimde sunmasına olanak tanır.

Varsayılan Çıktı

Sonuç formatı:

$query: $total\n$errors.format('$word ($suggest) - $type\n')

Sonuç örneği:

Hatalı sorgu: 1
obshibkoy (oshibkoy, obshivkoy) - Kelime sözlükte yok.
Yandex Speller veri kazıyıcı ile kontrol edilecek metin: 0
https://a-parser.com/: 10
podskazkazok (podskazok) - Kelime sözlükte yok.
danykh (dannykh, danykh) - Kelime sözlükte yok.
MOZ (DMOZ) - Kelime sözlükte yok.
NodeJS (Node JS) - Kelime sözlükte yok.
Razrabatyvay (Razrabatyvayu) - Kelime sözlükte yok.
...
https://en.wikipedia.org/wiki/Parsing: 183
• العربية (• العربية) - Metin çok fazla hata içeriyor.
• বাংলা (• বাংলা) - Metin çok fazla hata içeriyor.
...
material (material) - Kelime sözlükte yok.
parsed (passed) - Kelime sözlükte yok.
they (that) - Kelime sözlükte yok.
...

SQL Formatında Kaydetme

Sonuç formatı:

[% FOREACH errors;
"INSERT INTO errors VALUES('" _ word _ "', '" _ suggest _ "', '" _ type _ "')\n";
END %]

Sonuç örneği:

INSERT INTO errors VALUES('SaaS', 'Seas', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('serbest çalışanlar', '', 'Kelime sözlükte yok.')
INSERT INTO errors VALUES('Satış Ortakları', 'Satış Ortak ları', 'Kelime sözlükte yok.')
INSERT INTO errors VALUES('Youtube', 'YouTube', 'Büyük ve küçük harflerin yanlış kullanımı.')
INSERT INTO errors VALUES('e-postalar', 'postalar', 'Kelime sözlükte yok.')
INSERT INTO errors VALUES('WordStat', '', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('Link inşası', '', 'Kelime sözlükte yok.')
INSERT INTO errors VALUES('outreach', '', 'Kelime sözlükte yok.')
INSERT INTO errors VALUES('Alexa', '', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('SEMRush', '', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('Ahrefs', 'Href', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('MajesticSEO', '', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('SerpStat', '', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('serbest çalışanlar', '', 'Kelime sözlükte yok.')
INSERT INTO errors VALUES('SaaS', 'Saab,Seas,SAS', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('SaaS', 'Seas,SAS', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('NodeJS', 'Nodes', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('NodeJS', 'Nodes', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('async', 'sync', ''Kelime sözlükte yok.')
INSERT INTO errors VALUES('potansiyel müşteri oluşturma', 'potansiyel müşteri oluştur ma', 'Kelime sözlükte yok.')

Sonuçları JSON Olarak Dökme

Genel sonuç formatı:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.errors = p1.errors;

obj.json %]

Başlangıç metni:

[

Bitiş metni:

]

Sonuç örneği:

[{"errors": [{"word":"SaaS","suggest":"Seas","type":"Kelime sözlükte yok."},{"word":"serbest çalışanlar","suggest":"","type":"Kelime sözlükte yok."},{"word":"Satış Ortakları","suggest":"Satış Ortakları","type":"Kelime sözlükte yok."},{"word":"Youtube","suggest":"YouTube","type":"Büyük ve küçük harflerin yanlış kullanımı."},{"word":"e-postalar","suggest":"e-postalar","type":"Kelime sözlükte yok."},{"word":"WordStat","suggest":"","type":"Kelime sözlükte yok."},{"word":"Linkbuilding","suggest":"","type":"Kelime sözlükte yok."},{"word":"outreach","suggest":"","type":"Kelime sözlükte yok."},{"word":"Alexa","suggest":"","type":"Kelime sözlükte yok."},{"word":"SEMRush","suggest":"","type":"Kelime sözlükte yok."},{"word":"Ahrefs","suggest":"Href","type":"Kelime sözlükte yok."},{"word":"MajesticSEO","suggest":"","type":"Kelime sözlükte yok."},{"word":"SerpStat","suggest":"","type":"Kelime sözlükte yok."},{"word":"serbest çalışanlar","suggest":"","type":"Kelime sözlükte yok."},{"word":"SaaS","suggest":"Saab,Seas,SAS","type":"Kelime sözlükte yok."},{"word":"SaaS","suggest":"Seas,SAS","type":"Kelime sözlükte yok."},{"word":"NodeJS","suggest":"Nodes","type":"Kelime sözlükte yok."},{"word":"Parser'a","suggest":"","type":"Kelime sözlükte yok."},{"word":"NodeJS","suggest":"Nodes","type":"Kelime sözlükte yok."},{"word":"async","suggest":"sync","type":"Kelime sözlükte yok."},{"word":"lead üretimi","suggest":"lead üretimi","type":"Kelime sözlükte yok."},{"word":"Kazıyın","suggest":"Parite","type":"Kelime sözlükte yok."},{"word":"Instagram","suggest":"","type":"Kelime sözlükte yok."},{"word":"pazaryerleri","suggest":"","type":"Kelime sözlükte yok."},{"word":"pazaryerlerinin","suggest":"","type":"Kelime sözlükte yok."},{"word":"pazaryeri","suggest":"","type":"Kelime sözlükte yok."},{"word":"Instagram","suggest":"","type":"Kelime sözlükte yok."},{"word":"Bing","suggest":"","type":"Kelime sözlükte yok."},{"word":"haber siteleri","suggest":"","type":"Kelime sözlükte yok."},{"word":"Redis","suggest":"","type":"Kelime sözlükte yok."},{"word":"kazımak","suggest":"","type":"Kelime sözlükte yok."},{"word":"captcha","suggest":"","type":"Kelime sözlükte yok."},{"word":"XEvil","suggest":"Evil,Devil","type":"Kelime sözlükte yok."},{"word":"CapMonster","suggest":"Cap Monster","type":"Kelime sözlükte yok."},{"word":"Captcha","suggest":"","type":"Kelime sözlükte yok."},{"word":"RuCaptcha","suggest":"","type":"Kelime sözlükte yok."},{"word":"kazımak","suggest":"tartışmak","type":"Kelime sözlükte yok."},{"word":"kazımak","suggest":"","type":"Kelime sözlükte yok."},{"word":"kazımak","suggest":"sorgulamak","type":"Kelime sözlükte yok."},{"word":"brief","suggest":"","type":"Kelime sözlükte yok."},{"word":"ticketlar","suggest":"","type":"Kelime sözlükte yok."},{"word":"Parser’ile","suggest":"","type":"Kelime sözlükte yok."},{"word":"Parser'ile","suggest":"","type":"Kelime sözlükte yok."},{"word":"toollar","suggest":"düğümler,aslar,toollar","type":"Kelime sözlükte yok."}]}]

Olası Ayarlar

ParametreVarsayılan değerAçıklama
Languagesİngilizce, Rusça, UkraynacaKontrol dilleri
OptionsBüyük harflerle yazılmış kelimeleri atla (örneğin "VPC")., Rakam içeren kelimeleri atla (örneğin "avp17h4534")., İnternet adreslerini, e-posta adreslerini ve dosya adlarını atla., Roma rakamlarını yoksay ("I, II, III, ...").Kontrol seçenekleri
HTML::TextExtractor presetdefaultHTML::TextExtractorHTML::TextExtractor için preset. Metin kazıma ayarlarını belirtmenize olanak tanır