Chuyển đến nội dung chính

SE::Yandex::Suggest - Công cụ cào dữ liệu gợi ý tìm kiếm Yandex

Tổng quan về công cụ cào dữ liệu

Công cụ cào dữ liệu gợi ý tìm kiếm theo từ khóa trên Yandex. Nhờ công cụ cào dữ liệu SE::Yandex::Suggest, bạn có thể tự động thu thập cơ sở dữ liệu từ khóa từ các gợi ý của công cụ tìm kiếm Yandex theo truy vấn. Sử dụng công cụ cào dữ liệu SE::Yandex::Suggest giúp bạn cào dữ liệu gợi ý của Yandex theo truy vấn dựa trên khu vực một cách dễ dàng và nhanh chóng.

Công cụ cào dữ liệu gợi ý Yandex giải quyết một trong những nhiệm vụ chính của SEO, cụ thể là thu thập bộ từ khóa mở rộng một cách nhanh chóng và tự động. Các gợi ý tìm kiếm của Google cho phép bao phủ tối đa số lượng cụm từ, và khi kết hợp với công cụ cào dữ liệu Từ khóa Yandex - SE::Yandex::WordStatSE::Yandex::WordStat, bạn sẽ nhận được bộ từ khóa toàn diện nhất, giúp thu hút thêm nhiều lưu lượng truy cập tự nhiên.

Nhờ khả năng hoạt động đa luồng của A-Parser, tốc độ xử lý truy vấn có thể đạt tới 5700 truy vấn mỗi phút, cho phép nhận trung bình từ 17000-18000 kết quả mỗi phút.

Tổng quan về công cụ cào dữ liệu: tốc độ hoạt động

Bạn có thể sử dụng tính năng tự động nhân bản truy vấn, thay thế truy vấn phụ từ tệp, lặp qua các tổ hợp chữ-số và danh sách để nhận được số lượng kết quả tối đa có thể. Sử dụng lọc kết quả, bạn có thể làm sạch kết quả ngay lập tức bằng cách loại bỏ tất cả rác không cần thiết (sử dụng từ khóa loại trừ).

Tính năng của A-Parser cho phép lưu các cài đặt cào dữ liệu của công cụ cào dữ liệu SE::Yandex::Suggest để sử dụng sau này (preset), thiết lập lịch trình cào dữ liệu và nhiều tính năng khác.

Việc lưu kết quả có thể thực hiện theo định dạng và cấu trúc mà bạn cần, nhờ vào bộ tạo mẫu mạnh mẽ tích hợp sẵn Template Toolkit, cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm JSON, SQL và CSV.

Dữ liệu thu thập được

  • Số lượng kết quả theo truy vấn
  • Các gợi ý cho truy vấn
  • Khi chọn phương thức truy vấn thứ 2, các dữ liệu bổ sung và loại gợi ý cũng được thu thập
Dữ liệu thu thập được

Ứng dụng

  • Thu thập cơ sở dữ liệu từ khóa

Truy vấn

Trong phần truy vấn, bạn cần chỉ định các cụm từ tìm kiếm, ví dụ:

forex
viết tiểu luận
tiểu luận trực tuyến
mua xe tại Moscow
tin tức

Thay thế truy vấn

Bạn có thể sử dụng các macro tích hợp sẵn để tự động thay thế các truy vấn phụ từ tệp, ví dụ: chúng ta muốn thêm một danh sách các từ khác vào mỗi truy vấn, hãy chỉ định một vài truy vấn chính:

essay
article
thesis

Trong định dạng truy vấn, hãy chỉ định macro thay thế các từ bổ sung từ tệp Keywords.txt, phương pháp này cho phép tăng tính biến thiên của truy vấn lên nhiều lần:

{subs:Keywords} $query 

Macro này sẽ tạo ra số lượng truy vấn bổ sung tương ứng với số lượng từ trong tệp cho mỗi truy vấn tìm kiếm gốc, tổng cộng sẽ là [số lượng truy vấn gốc (tên miền)] x [số lượng truy vấn trong tệp Keywords] = [tổng số lượng truy vấn] sau khi macro hoạt động.

Ví dụ, nếu tệp Keywords.txt chứa:

buy
cheap

Kết quả là macro thay thế sẽ biến 3 truy vấn chính thành 6:

buy essay
cheap essay
buy article
cheap article
buy thesis
cheap thesis

Các ví dụ xuất kết quả

A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả ở dạng tùy ý cũng như có cấu trúc, ví dụ CSV hoặc JSON

Xuất danh sách gợi ý

Định dạng kết quả:

$results.format('$suggest\n')

Ví dụ kết quả:

tiểu luận trực tuyến miễn phí
đặt làm tiểu luận trực tuyến
tải tiểu luận trực tuyến miễn phí
tải tiểu luận trực tuyến
làm tiểu luận trực tuyến
thực hiện tiểu luận trực tuyến
tìm tiểu luận trực tuyến
làm tiểu luận trực tuyến miễn phí
đặt tiểu luận trực tuyến

Xuất truy vấn, tổng số gợi ý tìm thấy, các gợi ý theo truy vấn

Định dạng kết quả:

$query - $totalcount:\n$results.format('$suggest\n')

Ví dụ kết quả:

tiểu luận trực tuyến - 10:
tiểu luận trực tuyến
tiểu luận trực tuyến miễn phí
đặt làm tiểu luận trực tuyến
tải tiểu luận trực tuyến miễn phí
tải tiểu luận trực tuyến
làm tiểu luận trực tuyến
thực hiện tiểu luận trực tuyến
tìm tiểu luận trực tuyến
làm tiểu luận trực tuyến miễn phí
đặt tiểu luận trực tuyến

Xuất ra bảng CSV

Tiện ích tích hợp $tools.CSVLine cho phép tạo các tài liệu bảng chính xác, sẵn sàng để nhập vào Excel hoặc Google Sheets.

Định dạng kết quả:

[% FOREACH i IN results;
tools.CSVline(i.suggest);
END %]

Tên tệp:

$datefile.format().csv

Văn bản bắt đầu:

Gợi ý

mẹo

Trong Định dạng kết quả chung, bộ tạo mẫu Template Toolkit được áp dụng để xuất các phần tử suggest của mảng results trong vòng lặp FOREACH.

Trong tên tệp kết quả, bạn chỉ cần thay đổi phần mở rộng của tệp thành csv.

Để tùy chọn "Prepend text" hiển thị trong Trình chỉnh sửa tác vụ, bạn cần kích hoạt "More options". Trong "Prepend text", ghi tên các cột cách nhau bằng dấu phẩy và để dòng thứ hai trống.

Cạnh tranh từ khóa

Tương tự như trong SE::Yandex.

Lưu ở định dạng SQL

Định dạng kết quả:

[% FOREACH results;
"INSERT INTO serp VALUES('" _ query _ "', '"; suggest _ "')\n";
END %]

Ví dụ kết quả:

INSERT INTO serp VALUES('luận văn trực tuyến', 'luận văn trực tuyến')
INSERT INTO serp VALUES('luận văn trực tuyến', 'luận văn trực tuyến miễn phí')
INSERT INTO serp VALUES('luận văn trực tuyến', 'đặt làm luận văn trực tuyến')
INSERT INTO serp VALUES('luận văn trực tuyến', 'tải luận văn trực tuyến miễn phí')
INSERT INTO serp VALUES('luận văn trực tuyến', 'tải luận văn trực tuyến')
INSERT INTO serp VALUES('luận văn trực tuyến', 'làm luận văn trực tuyến')
INSERT INTO serp VALUES('luận văn trực tuyến', 'thực hiện luận văn trực tuyến')
INSERT INTO serp VALUES('luận văn trực tuyến', 'tìm luận văn trực tuyến')
...

Xuất kết quả sang JSON

Định dạng kết quả chung:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.totalcount = p1.totalcount;
obj.suggests = [];

FOREACH item IN p1.serp;
obj.suggests.push(item.suggest);
END;

obj.json %]

Văn bản bắt đầu:

[

Văn bản kết thúc:

]

Ví dụ kết quả:

[{"suggests":["tiểu luận trực tuyến","tiểu luận trực tuyến miễn phí","đặt làm tiểu luận trực tuyến","tải tiểu luận trực tuyến miễn phí","tải tiểu luận trực tuyến","làm tiểu luận trực tuyến","thực hiện tiểu luận trực tuyến","tìm tiểu luận trực tuyến","làm tiểu luận trực tuyến miễn phí","đặt tiểu luận trực tuyến"],"totalcount":10}]
mẹo

Để các tùy chọn "Prepend text" và "Append text" hiển thị trong Trình chỉnh sửa tác vụ, bạn cần kích hoạt "More options".

Xử lý kết quả

A-Parser cho phép xử lý kết quả trực tiếp trong quá trình cào dữ liệu, trong phần này chúng tôi đưa ra các trường hợp phổ biến nhất cho công cụ cào dữ liệu SE::Yandex::Suggest

Tùy chọn Cào đến cấp độ (Parse to level)

Tùy chọn này chỉ định công cụ cào dữ liệu đưa các kết quả nhận được vào hàng đợi truy vấn theo chiều sâu đến cấp độ đã chỉ định, ví dụ:

  • Nếu chỉ định cấp độ 1, công cụ cào dữ liệu sẽ thêm vào truy vấn tất cả các kết quả nhận được từ truy vấn gốc
  • Nếu chỉ định cấp độ 2, công cụ cào dữ liệu sẽ thêm vào truy vấn tất cả các kết quả nhận được từ truy vấn gốc + tất cả các kết quả nhận được từ các truy vấn ở cấp độ 1
  • v.v.

Nói một cách đơn giản - đây là việc đưa các kết quả nhận được vào hàng đợi truy vấn, điều này cho phép cào được nhiều kết quả hơn. Vì trong kết quả có khả năng sẽ có các bản trùng lặp, để công cụ cào dữ liệu không làm việc thừa (không cào cùng một thứ), khuyến nghị nên bật khử trùng lặp truy vấn (Unique queries)

Tùy chọn Cào đến cấp độ
Tải ví dụ

Cách nhập ví dụ vào A-Parser

eJx1VFtv2jAU/iuVhdRVQggKfVjeKCrSJtZ0pX2YgAe3Pom8OrZnO6woyn/vsRPi
wLoXy+f2nct37Io4at/sgwELzpJkUxEd7iQhDDJaCkeGRFNjwXjzhqzvkuQXlQze
k2Rd5jlY79H5VsQdNGC02oMxnAEaOUM5U6agDrEbyD0VpXcbNBo7auxfLge2Ad1u
5eUVqXuA2nEl7REv1LSCPYiINhnX/y9AmOh4PZnWu92QtMmXIbevRk9Gbf+dcU33
8KR8B1xAVC9RuqdF6IFRB956bOJq5N49AmWM+6KpaDL4Ccasz5L/CTOQCn3xajjY
pVEFqhwEAK88HKvbkEGQCUKUIfZnE0OSjAoLQ2Kx1CXFQti5hTsw1CmTtkNMKqLk
XIgwwOgW8G9LLhjSPc8w6Fsb+LlL+g9G3bXXT4VU/DVYQ4cSpNv0R4xiaqXy4zAE
L7hD2S5UKT0xY1S+AehuZvferVAGujQtcpsdN1qD9LxHyuY6qk7aOKHlVPmqZMbz
tN2lo2cpn/DZpHKhCi3A9yVLIZAWC49xPea2pcELscDz4EVIcfLgnFLCfl83pWrD
cf1ufIEFTrKftYV8pUI8P676Fh9ondKpvDPmjL6wGGRbjmezsT+nN+E+690bfThn
1+F8uQgqCCcL50t0mn5t9TIwewHW0gPxlTnIFe4szq3edT9J999Un/4nSVXjRvy2
D423H5/3RR3yYJFufOr1Bxh5omw=

Lọc kết quả (sử dụng từ khóa loại trừ)

Bằng cách sử dụng từ khóa loại trừ, bạn có thể loại bỏ ngay lập tức các kết quả mà bạn không cần. Tương tự, bằng cách sử dụng bộ lọc, bạn cũng có thể chỉ giữ lại những kết quả chứa các từ cần thiết.

Lọc kết quả (sử dụng từ khóa loại trừ)
Tải ví dụ

Cách nhập ví dụ vào A-Parser

eJx1VN9vGjEM/leqCKmrVCEoIG33RlGRNrHSFfowAQ+BMyxrLrklOVbE7n+f44S7
g3UvUWx/tr/4R47McftqnwxYcJYliyPL6c4SlsKWF9KxW5ZzY8F484LNHpLkO1cp
vCXJrNjtwHpEhT0yd8gBvfUejBEpoFGkKG+1ybjD2CHknsvCw1pBY9vB/uG6ZUPQ
5VJd37CyETB3Qit7ikecJrAHWUfrdsr/E5CmBt51ew3kVkgH3hrZJYt488kiHba6
jbh5cDKgtEPGmx+N1yyLTr/f92fvI51r0mzovvlDQpeEAd07DWi4rwnUu2sY+rVD
z78mFAKzsXK1OpG2Y6qfr2jebcceVsYZ38Nch6dCrR6j9Mgz6kPKHXjrqRE3bffm
I/A0FT4flyGDn4I664sSv+jlSiMWr0aAHRudocoBBfDKw4ndgrVI9uUsyPdb8GHJ
lksLWG+kOuZIJL20CCw+d9pM4yAkR6bVUEoaghpG8e8LIVMc2eEWnT5Hx/ch039i
lNXzmqlwnH4b5FBFIel++rX2SvVE707FkCITDmU70oXyjemg8hUgr2r26GGZNlCl
iZFjdtzKHJSf3bplw7xWnT3jrC3nyo1WW7Gbxn04IQs1x9WfqpHOcgn+XaqQEtti
4bkej6GNbfBCTfDSeUQpzj4Np7W0X2aBam4Ejt/AE8ywks2sMeSGS/nyPGlavKN1
Op+qB2Mu2keDwRpLNGjsXnO56OzTPvXXV2GJ6EzrBY279ynqFXX2CqzlB+aZOdhp
nFmsW7mqfsPqzzy++ycmxxIn4qd9CmhfPo9FHfbB0gJ3y7/kMN7o
mẹo

Các cài đặt có thể

Tên tham sốGiá trị mặc địnhMô tả
RegionNgaChọn khu vực thực hiện tìm kiếm
Request methodMethod 1Phương thức truy vấn: Method 1 - phương pháp cũ, giống như trước đây; Method 2 - phương pháp mới, cho phép thu thập tất cả các gợi ý mở rộng (quảng cáo, sự thật, liên kết đến trang web)