Chuyển đến nội dung chính

SE::Yandex::WordCraft - Công cụ cào dữ liệu WordCraft. Gợi ý truy vấn và phân tích thị trường

img

Tổng quan về công cụ cào dữ liệu

Yandex WordCraft (Wordcraft) là một phần của dịch vụ Yandex Webmaster, giúp bạn lựa chọn các truy vấn mục tiêu để quảng bá và quảng cáo, có tính đến mức độ phổ biến và môi trường cạnh tranh. Hàng trăm triệu truy vấn duy nhất có sẵn để phân tích. Nhu cầu, lượt hiển thị, lượt nhấp, vị trí được cung cấp dưới dạng trung bình hàng tháng trong năm qua.

Công cụ cào dữ liệu truy vấn Yandex WordCraft hỗ trợ tự động nhân bản truy vấn, bạn có thể chắc chắn rằng mình sẽ nhận được số lượng kết quả tối đa từ kết quả tìm kiếm.

Tính năng của A-Parser cho phép lưu các cài đặt cào dữ liệu để sử dụng sau này (preset), thiết lập lịch trình cào dữ liệu và nhiều tính năng khác. Bạn có thể sử dụng tính năng tự động nhân bản truy vấn, thay thế các truy vấn phụ từ tệp, liệt kê các tổ hợp chữ-số và danh sách để nhận được số lượng kết quả tối đa có thể khi cào dữ liệu Yandex Wordstat.

Việc lưu kết quả có thể thực hiện dưới bất kỳ hình thức và cấu trúc nào bạn cần, nhờ vào bộ tạo mẫu mạnh mẽ được tích hợp sẵn Template Toolkit cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm TXT, JSON, SQL và CSV.

Tài khoản

Để công cụ cào dữ liệu SE::Yandex::WordCraftSE::Yandex::WordCraft hoạt động, cần có tài khoản Yandex. Bạn có thể đăng ký tài khoản bằng công cụ cào dữ liệu SE::Yandex::RegisterSE::Yandex::Register hoặc chỉ cần thêm các tài khoản hiện có vào tệp files/SE-Yandex/accounts.txt theo định dạng được hỗ trợ.

Hoặc bạn có thể bật tính năng đăng ký tài khoản "ngay tức thì".

Để làm việc bằng cách sử dụng xác thực theo phiên (session), chuỗi dữ liệu phải có định dạng sau: [email protected];MAQT78Z31Rinx4H;{"answer":"qmfhsxdcrk","proxy":"185.104.120.45:3128","session_id":"3:1748440908.5.0.1748440867459:ZXBxpg:47e4.1.2:1|2191075974.41.2.2:41.3:1748440908|3:10308131.797655.5pfkoRZWgLJGntKTlcUhYdysNfk"}

Dữ liệu thu thập được

  • Truy vấn của người dùng (chính):
    • Truy vấn, tính cạnh tranh, nhu cầu, lượt nhấp
  • Truy vấn của người dùng (bổ sung):
    • Truy vấn, tính cạnh tranh, nhu cầu, lượt nhấp
  • Các trang web phổ biến trong tìm kiếm Yandex (trang web):
    • Trang web, tần suất hiển thị, vị trí trung bình
  • Các trang web phổ biến trong tìm kiếm Yandex (trang):
    • URL, tần suất hiển thị, vị trí trung bình, số lượng truy vấn, tiêu đề

Ứng dụng

  • Đánh giá tính cạnh tranh theo từ khóa (nhu cầu, lượt nhấp)
  • Tìm kiếm các từ khóa mới cùng chủ đề
  • Thu thập cơ sở dữ liệu từ khóa lớn thuộc các chủ đề khác nhau
  • Bất kỳ phương án nào khác liên quan đến việc cào dữ liệu Yandex Webmaster WordCraft dưới hình thức này hay hình thức khác

Truy vấn

Trong phần truy vấn, bạn cần chỉ định các từ khóa, giống như khi bạn nhập chúng trực tiếp vào trường tìm kiếm theo truy vấn của Wordcraft, ví dụ:

máy hút bụi
seo

Các tùy chọn xuất kết quả

A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả ở dạng tùy ý cũng như dạng có cấu trúc, ví dụ CSV hoặc JSON

Xuất mặc định

Ví dụ về việc xuất danh sách truy vấn của người dùng (chính). Định dạng kết quả:

User queries general: $uqg.format('$query,$compet,$demand,$clicks\n')

Danh sách kết quả:

máy hút bụi,HIGH,33190,9248
máy hút bụi,HIGH,31204,8768
máy hút bụi,HIGH,14097,6082
...
máy hút bụi,HIGH,791,656
ghi chú

Để xuất kết quả bằng cách sử dụng Định dạng kết quả chung bạn cần chỉ định số thứ tự của công cụ cào dữ liệu trong tác vụ - $p1. (parser 1) hoặc p1. nếu sử dụng bộ tạo mẫu Template Toolkit. Ví dụ:

User queries general: $p1.uqg.format('$query,$compet,$demand,$clicks\n')

Xem Định dạng kết quả chung là gì trong Chỉnh sửa định dạng kết quả

Xuất ra bảng CSV

Ví dụ về việc xuất danh sách truy vấn của người dùng (chính) ra bảng CSV. Định dạng kết quả:

[%  
FOREACH uqg;
tools.CSVline(query,compet,demand,clicks);
END;
%]

Ví dụ về việc xuất danh sách truy vấn của người dùng (bổ sung) ra bảng CSV. Định dạng kết quả:

[%  
FOREACH uqa;
tools.CSVline(query,compet,demand,clicks);
END;
%]

Ví dụ về việc xuất danh sách các trang web phổ biến trong tìm kiếm Yandex (trang web) ra bảng CSV. Định dạng kết quả:

[%  
FOREACH rs;
tools.CSVline(site,popul,position);
END;
%]

Ví dụ về việc xuất danh sách các trang web phổ biến trong tìm kiếm Yandex (trang) ra bảng CSV. Định dạng kết quả:

[%  
FOREACH rp;
tools.CSVline(url,popul,position,queries,title);
END
%]
mẹo

Tùy chọn

  • Parse queries for Rivals pages - khi bật tùy chọn này, các truy vấn phổ biến cho mỗi liên kết trong Rivals pages sẽ được thu thập. Dữ liệu thu thập được ghi dưới dạng đối tượng JSON trong biến $rp.$i.queries_json. Việc bật tùy chọn này làm tăng đáng kể thời gian cào dữ liệu, vì công cụ cào dữ liệu sẽ thực hiện nhiều truy vấn phụ bổ sung.

Các cài đặt có thể có

Tham sốGiá trị mặc địnhMô tả
AntiGate presetdefaultCần cấu hình trước công cụ cào dữ liệu Util::AntiGateUtil::AntiGate - chỉ định khóa truy cập của bạn và các tham số khác, sau đó chọn preset đã tạo tại đây
AntiGate preset for LogindefaultPreset AntiGate để đăng nhập. Cần cấu hình trước công cụ cào dữ liệu Util::AntiGateUtil::AntiGate với các tham số, sau đó chọn preset đã tạo tại đây
AccountsOnly from "accounts.txt"Chọn phương pháp làm việc với tài khoản: Always auto register - luôn tự động đăng ký tài khoản "ngay tức thì", yêu cầu chọn preset đã cấu hình trong tham số SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - trước tiên sử dụng các tài khoản hiện có từ accounts.txt, và nếu hết - sử dụng đăng ký tự động "ngay tức thì", theo đó cần chọn preset đã cấu hình trong tham số SE::Yandex::Register preset. Only from "accounts.txt" - chỉ sử dụng các tài khoản hiện có từ accounts.txt, và nếu hết - chờ một khoảng thời gian xác định (tham số Wait new accounts in "accounts.txt") để có tài khoản mới. Only by session_id from "accounts.txt" - xác thực bằng cookie.
Wait new accounts in "accounts.txt"0Thời gian chờ đợi tài khoản mới xuất hiện trong accounts.txt
Remove bad accountsAlways, except wrong login/passwordTự động xóa các tài khoản "xấu": Always - luôn xóa. Always, except wrong login/password - luôn xóa, ngoại trừ trường hợp Yandex thông báo sai tên đăng nhập/mật khẩu. Thực tế là Yandex có thể đưa ra thông báo như vậy khi IP bị chặn đối với một tài khoản hoàn toàn bình thường, vì vậy có thể tùy chọn giữ lại các tài khoản đó để sử dụng lại. Never - không bao giờ xóa. Bất kể tùy chọn nào được chọn, tài khoản sẽ không bị xóa khi có lỗi proxy/trình duyệt
SE::Yandex::Register presetdefaultChọn preset cài đặt cho SE::Yandex::RegisterSE::Yandex::Register
Use sessionsSử dụng phiên (session)
Do not reset session if authorization passedKhông đặt lại phiên khi có lỗi nếu công cụ cào dữ liệu đã được xác thực
SE::Yandex::Register presetdefaultChọn preset cài đặt cho SE::Yandex::RegisterSE::Yandex::Register