SE::Yandex::WordStat::ByDate - Công cụ cào dữ liệu thống kê lượt hiển thị Yandex WordStat theo tháng hoặc tuần

Tổng quan về công cụ cào dữ liệu
Wordstat là một dịch vụ của Yandex, được thiết kế để đánh giá sự quan tâm của người dùng đối với các chủ đề khác nhau và lựa chọn từ khóa để tối ưu hóa SEO và quảng cáo ngữ cảnh. Ngoài ra, với sự trợ giúp của Wordstat Yandex, bạn có thể đánh giá tính thời vụ và sự phụ thuộc về địa lý của các truy vấn tìm kiếm.
Công cụ cào dữ liệu Yandex WordStat by date hỗ trợ tự động nhân bản truy vấn, bạn có thể chắc chắn rằng mình sẽ nhận được số lượng kết quả tối đa từ kết quả tìm kiếm. Ngoài ra, A-Parser có thể tự động chuyển sang các truy vấn liên quan ở độ sâu được chỉ định.
Chức năng của A-Parser cho phép lưu các cài đặt cào dữ liệu để sử dụng sau này (preset), thiết lập lịch trình cào dữ liệu và nhiều tính năng khác. Bạn có thể sử dụng tính năng tự động nhân bản truy vấn, thay thế các truy vấn phụ từ tệp, duyệt qua các tổ hợp chữ-số và danh sách để có được số lượng kết quả lớn nhất có thể.
Việc lưu kết quả có thể thực hiện dưới bất kỳ hình thức và cấu trúc nào bạn cần, nhờ vào bộ tạo mẫu mạnh mẽ được tích hợp sẵn Template Toolkit cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm JSON, SQL và CSV.
Các trường hợp ứng dụng công cụ cào dữ liệu
🔗 Tự động hóa Wordstat bydate
Được sử dụng để lưu trữ thông tin cập nhật trong cơ sở dữ liệu và tạo tệp csv với dữ liệu mới sau mỗi lần chạy
Tài khoản
Để công cụ cào dữ liệu
SE::Yandex::WordStat::ByDate hoạt động, cần có tài khoản Yandex. Tài khoản có thể được đăng ký bằng công cụ cào dữ liệu
SE::Yandex::Register hoặc chỉ cần thêm các tài khoản hiện có vào tệp files/SE-Yandex/accounts.txt theo định dạng được hỗ trợ.
Hoặc bạn có thể bật tính năng đăng ký tài khoản "ngay lập tức".
Dữ liệu thu thập được
- Thống kê từ khóa theo tháng hoặc tuần
- Ngày
- Giá trị tuyệt đối
- Giá trị tương đối

Tính năng
- Hỗ trợ chọn khu vực tìm kiếm (với các nhóm phụ)
- Khả năng chọn nhiều khu vực cùng lúc để đánh giá
- Hỗ trợ tự động vượt qua Smart captcha và khả năng vượt qua captcha hình ảnh bằng dịch vụ AntiCaptcha hoặc bất kỳ dịch vụ nào khác hỗ trợ API của họ
- Chọn loại thiết bị
- Khả năng chọn phương thức xác thực
- Khả năng đăng ký tài khoản "ngay lập tức"
- Hỗ trợ làm việc với định dạng tài khoản mở rộng và có thể trả lời câu hỏi bảo mật (nếu câu trả lời có trong
info). Đồng thời sử dụng proxy đã lưu để xác thực (nếu có tronginfo).
Các phương án sử dụng
- Đánh giá lượng lưu lượng truy cập theo từ khóa
- Xác định các từ khóa theo mùa
Truy vấn
Trong phần truy vấn, bạn cần chỉ định các từ khóa, giống như khi bạn nhập chúng trực tiếp vào biểu mẫu tìm kiếm của Wordstat, ví dụ:
test
Các phương án xuất kết quả
A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả ở dạng tùy ý, cũng như dạng có cấu trúc như CSV hoặc JSON
Xuất mặc định
Định dạng kết quả:
Views:\n$views.format('$date $count $relcount\n')
Kết quả hiển thị thống kê từ khóa theo tháng và theo tuần:
Monthly:
2011-09-30 3010832 0.0008903808
2011-10-31 681432 0.0001825883
2011-11-30 628532 0.0001575008
2011-12-31 629072 0.0001495699
2012-01-31 561206 0.0001300651
2012-02-29 572039 0.0001290000
2012-03-31 614897 0.0001225754
2012-04-30 520433 0.0001185340
2012-05-31 521967 0.0001235327
2012-06-30 502568 0.0001299958
...
Weekly:
2012-09-16 118715 0.0001222877
2012-09-23 120799 0.0001211773
2012-09-30 137809 0.0001365837
2012-10-07 133929 0.0001313643
2012-10-14 140373 0.0001293922
2012-10-21 136014 0.0001242209
2012-10-28 148350 0.0001293328
2012-11-04 139556 0.0001232566
2012-11-11 154830 0.0001314057
2012-11-18 136458 0.0001147489
2012-11-25 149463 0.0001261401
2012-12-02 144724 0.0001197564
2012-12-09 149142 0.0001212195
2012-12-16 162864 0.0001298181
Xuất ra bảng CSV
Định dạng kết quả:
[% FOREACH i IN views;
tools.CSVline(query, i.count, i.date);
END %]
Ví dụ kết quả:
"test",9661734,2012-03-31
"test",8567243,2012-04-30
"test",9028986,2012-05-31
"test",6082099,2012-06-30
"test",5531950,2012-07-31
"test",5214663,2012-08-31
"test",6603865,2012-09-30
"test",9127457,2012-10-31
"test",9238652,2012-11-30
Lưu ở định dạng SQL
Định dạng kết quả:
[% FOREACH i IN views;
"INSERT INTO views VALUES('" _ query _ "', '"; i.count _ "', '"; i.relcount _ "', '"; i.date _ "')\n";
END %]
Ví dụ kết quả:
INSERT INTO serp VALUES('test', '9661734', '0.0019259985', '2012-03-31')
INSERT INTO serp VALUES('test', '8567243', '0.0019512785', '2012-04-30')
INSERT INTO serp VALUES('test', '9028986', '0.0021368683', '2012-05-31')
INSERT INTO serp VALUES('test', '6082099', '0.0015732140', '2012-06-30')
INSERT INTO serp VALUES('test', '5531950', '0.0013160071', '2012-07-31')
INSERT INTO serp VALUES('test', '5214663', '0.0013327945', '2012-08-31')
INSERT INTO serp VALUES('test', '6603865', '0.0015936909', '2012-09-30')
INSERT INTO serp VALUES('test', '9127457', '0.0018740506', '2012-10-31')
INSERT INTO serp VALUES('test', '9238652', '0.0018308715', '2012-11-30')
Xuất kết quả sang JSON
Định dạng kết quả chung:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.views = [];
FOREACH item IN p1.views;
obj.views.push({
date = item.date
relcount = item.relcount
count = item.count
});
END;
obj.json %]
Văn bản bắt đầu:
[
Văn bản kết thúc:
]
Ví dụ kết quả:
[{
"views": [
{
"count": "9661734",
"date": "2012-03-31",
"relcount": "0.0019259985"
},
{
"count": "8567243",
"date": "2012-04-30",
"relcount": "0.0019512785"
},
{
"count": "9028986",
"date": "2012-05-31",
"relcount": "0.0021368683"
}
]
}]
Xem thêm: Bộ lọc kết quả
Các cài đặt có thể có
| Tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| Period | Monthly | Chọn khoảng thời gian (Monthly/Weekly/Daily, Daily chỉ hoạt động khi bật tùy chọn Use Wordstat 2) |
| Start date | | Chỉ định ngày bắt đầu tìm kiếm. Chỉ hoạt động khi bật tùy chọn Use Wordstat 2. Bắt buộc phải tuân thủ các quy tắc chỉ định ngày |
| End date | | Chỉ định ngày kết thúc tìm kiếm. Chỉ hoạt động khi bật tùy chọn Use Wordstat 2. Bắt buộc phải tuân thủ các quy tắc chỉ định ngày |
| Region | All | Khu vực tìm kiếm |
| AntiGate preset | default | Cần cấu hình trước công cụ cào dữ liệu Util::AntiGate - chỉ định khóa truy cập của bạn và các tham số khác, sau đó chọn preset đã tạo tại đây |
| AntiGate preset for Login | default | Preset AntiGate để đăng nhập. Cần cấu hình trước công cụ cào dữ liệu Util::AntiGate với các tham số, sau đó chọn preset đã tạo tại đây |
| Type | All | Chọn loại thiết bị |
| Accounts | Only from "accounts.txt" | Chọn phương thức làm việc với tài khoản: Always auto register - luôn tự động đăng ký tài khoản "ngay lập tức", yêu cầu chọn preset đã cấu hình trong tham số SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - trước tiên sử dụng các tài khoản hiện có từ accounts.txt, nếu hết - sử dụng đăng ký tự động "ngay lập tức", yêu cầu chọn preset đã cấu hình trong tham số SE::Yandex::Register preset. Only from "accounts.txt" - chỉ sử dụng các tài khoản hiện có từ accounts.txt, nếu hết - chờ thời gian đã định (tham số Wait new accounts in "accounts.txt") để có tài khoản mới |
| Wait new accounts in "accounts.txt" | 0 | Thời gian chờ tài khoản mới xuất hiện trong accounts.txt |
| Remove bad accounts | Always, except wrong login/password | Tự động xóa các tài khoản "xấu": Always - luôn xóa. Always, except wrong login/password - luôn xóa, ngoại trừ trường hợp Yandex thông báo sai tên đăng nhập/mật khẩu. Thực tế là Yandex có thể đưa ra thông báo này khi chặn IP đối với một tài khoản hoàn toàn bình thường, vì vậy có thể tùy chọn giữ lại các tài khoản đó để sử dụng lại. Never - không bao giờ xóa. Bất kể tùy chọn nào được chọn, tài khoản sẽ không bị xóa khi gặp lỗi proxy/trình duyệt |
| SE::Yandex::Register preset | default | Chọn preset cài đặt cho SE::Yandex::Register |
| Authorization method | HTTP | Phương thức xác thực: HTTP - nhanh, ít tốn tài nguyên. Chrome - chậm, tốn tài nguyên, về lý thuyết có thể kéo dài tuổi thọ tài khoản |
| Chrome headless | ☑ | Nếu tùy chọn này được bật, trình duyệt sẽ không hiển thị |
| Use sessions | ☑ | Sử dụng phiên làm việc (session) |
| Do not reset session if authorization passed | ☑ | Không đặt lại phiên khi gặp lỗi nếu công cụ cào dữ liệu đã được xác thực |
| Use Wordstat 2 | ☐ | Sử dụng Wordstat 2 |
| Wordstat 2 parse all table data | ☑ | Cho phép tải ngay tất cả 2000 kết quả theo truy vấn mà không cần duyệt qua phân trang |
