SE::Yandex::WordStat::ByRegion -

Tổng quan về công cụ cào dữ liệu
Wordstat là một dịch vụ của Yandex, được thiết kế để đánh giá sự quan tâm của người dùng đối với các chủ đề khác nhau và lựa chọn từ khóa để tối ưu hóa SEO và quảng cáo ngữ cảnh. Ngoài ra, với sự trợ giúp của Wordstat Yandex, bạn có thể đánh giá tính thời vụ và sự phụ thuộc về địa lý của các truy vấn tìm kiếm.
Công cụ cào dữ liệu Yandex WordStat by region hỗ trợ tự động nhân bản truy vấn, bạn có thể chắc chắn rằng mình sẽ nhận được số lượng kết quả tối đa từ kết quả tìm kiếm. Ngoài ra, A-Parser có thể tự động chuyển sang các truy vấn liên quan đến độ sâu được chỉ định.
Chức năng của A-Parser cho phép lưu các cài đặt cào dữ liệu để sử dụng sau này (preset), thiết lập lịch trình cào dữ liệu và nhiều tính năng khác. Bạn có thể sử dụng tính năng tự động nhân bản truy vấn, thay thế các truy vấn phụ từ tệp, lặp qua các tổ hợp chữ-số và danh sách để có được số lượng kết quả tối đa có thể.
Việc lưu kết quả có thể thực hiện ở bất kỳ dạng và cấu trúc nào bạn cần, nhờ vào bộ tạo mẫu mạnh mẽ được tích hợp sẵn Template Toolkit cho phép áp dụng logic bổ sung cho kết quả và xuất dữ liệu ở nhiều định dạng khác nhau, bao gồm JSON, SQL và CSV.
Tài khoản
Để công cụ cào dữ liệu
SE::Yandex::WordStat::ByRegion hoạt động, cần có tài khoản Yandex. Bạn có thể đăng ký tài khoản bằng công cụ cào dữ liệu
SE::Yandex::Register hoặc chỉ cần thêm các tài khoản hiện có vào tệp files/SE-Yandex/accounts.txt theo định dạng được hỗ trợ.
Hoặc bạn có thể bật tính năng đăng ký tài khoản "ngay lập tức".
Dữ liệu thu thập được
- Tổng số lượt hiển thị cho mỗi truy vấn
- Thống kê từ khóa theo khu vực và thành phố:
- Khu vực/Thành phố
- Số lượt xem mỗi tháng
- Mức độ phổ biến theo khu vực tính bằng %
Tính năng
- Hỗ trợ tự động vượt qua Smart captcha và khả năng vượt qua captcha hình ảnh bằng dịch vụ AntiCaptcha hoặc bất kỳ dịch vụ nào khác hỗ trợ API của họ
- Lựa chọn loại thiết bị
- Khả năng chọn phương thức xác thực
- Khả năng đăng ký tài khoản "ngay lập tức"
- Hỗ trợ làm việc với định dạng tài khoản mở rộng và có thể trả lời câu hỏi bí mật (nếu câu trả lời có trong
info). Đồng thời sử dụng proxy đã lưu để xác thực (nếu có tronginfo).
Ứng dụng
- Đánh giá lượng truy cập theo từ khóa theo từng khu vực
Truy vấn
Trong phần truy vấn, bạn cần chỉ định các từ khóa, giống như khi bạn nhập chúng trực tiếp vào biểu mẫu tìm kiếm của Wordstat, ví dụ:
test
Các ví dụ về định dạng kết quả
A-Parser hỗ trợ định dạng kết quả linh hoạt nhờ bộ tạo mẫu tích hợp Template Toolkit, cho phép xuất kết quả ở dạng tùy ý, cũng như dạng có cấu trúc như CSV hoặc JSON
Đầu ra mặc định
Định dạng kết quả:
$query - Total views: $totalcount\nViews by regions:\n$regions.format('$region $count, $popularity%\n')\nViews by cities:\n$cities.format('$city $count, $popularity%\n')
Kết quả hiển thị số lượt hiển thị cho truy vấn, thống kê từ khóa theo khu vực và thành phố, số lượt xem mỗi tháng và mức độ phổ biến theo khu vực:
test - Total views: 872855
Views by regions:
Moscow và Tỉnh Moscow 147107, 85%
Trung tâm 194716, 77%
Tây Bắc 55815, 70%
Miền Nam 31759, 67%
Vùng Volga 86006, 66%
...
Views by cities:
Chita 2937, 113%
Saint Petersburg 35713, 73%
Belgorod 2737, 58%
Ivanovo 1773, 55%
Kaluga 2196, 64%
Kostroma 1166, 49%
Xuất ra bảng CSV
Định dạng kết quả:
[% FOREACH i IN regions;
tools.CSVline(query, i.popularity, i.region, i.count);
END %]
Ví dụ kết quả:
"test",88,"Moscow và Tỉnh Moscow",1902795
"test",96,"Trung tâm",2992864
"test",95,"Tây Bắc",926138
"test",112,Miền Nam,647140
"test",124,"Vùng Volga",1927873
"test",64,"Miền Tây",60975
"test",86,"Miền Đông",427304
Lưu ở định dạng SQL
Định dạng kết quả:
[% FOREACH i IN regions;
"INSERT INTO regions VALUES('" _ query _ "', '"; i.popularity _ "', '"; i.count _ "', '"; i.region _ "')\n";
END %]
Ví dụ kết quả:
INSERT INTO regions VALUES('test', '88', '1902795', 'Moscow và Tỉnh Moscow')
INSERT INTO regions VALUES('test', '96', '2992864', 'Trung tâm')
INSERT INTO regions VALUES('test', '95', '926138', 'Tây Bắc')
INSERT INTO regions VALUES('test', '112', '647140', 'Miền Nam')
INSERT INTO regions VALUES('test', '124', '1927873', 'Vùng Volga')
INSERT INTO regions VALUES('test', '64', '60975', 'Miền Tây')
INSERT INTO regions VALUES('test', '86', '427304', 'Miền Đông')
INSERT INTO regions VALUES('test', '80', '89569', 'Miền Nam')
INSERT INTO regions VALUES('test', '75', '356560', 'Trung tâm')
INSERT INTO regions VALUES('test', '77', '34894', 'Miền Bắc')
Dump kết quả sang JSON
Định dạng kết quả chung:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.totalcount = p1.totalcount;
obj.regions = [];
FOREACH item IN p1.regions;
obj.regions.push({
popularity = item.popularity
region = item.region
count = item.count
});
END;
obj.json %]
Văn bản bắt đầu:
[
Văn bản kết thúc:
]
Ví dụ kết quả:
[
{
"regions": [
{
"count": "1902795",
"popularity": 88,
"region": "Moscow và Tỉnh Moscow"
},
{
"count": "2992864",
"popularity": 96,
"region": "Trung tâm"
},
{
"count": "926138",
"popularity": 95,
"region": "Tây Bắc"
},
{
"count": "647140",
"popularity": 112,
"region": "Miền Nam"
},
{
"count": "34894",
"popularity": 77,
"region": "Miền Bắc"
},
],
"totalcount": "10837937"
}
]
Xem thêm: Bộ lọc kết quả
Các cài đặt có thể có
| Tham số | Giá trị mặc định | Mô tả |
|---|---|---|
| AntiGate preset | default | Cần cấu hình trước công cụ cào dữ liệu Util::AntiGate - chỉ định khóa truy cập của bạn và các tham số khác, sau đó chọn preset đã tạo tại đây |
| AntiGate preset for Login | default | Preset AntiGate để đăng nhập. Cần cấu hình trước công cụ cào dữ liệu Util::AntiGate với các tham số, sau đó chọn preset đã tạo tại đây |
| Type | All | Lựa chọn loại thiết bị |
| Accounts | Only from "accounts.txt" | Lựa chọn phương thức làm việc với tài khoản: Always auto register - luôn tự động đăng ký tài khoản "ngay lập tức", yêu cầu chọn preset đã cấu hình trong tham số SE::Yandex::Register preset. Auto register if no more in "accounts.txt" - đầu tiên sử dụng các tài khoản hiện có từ accounts.txt, nếu hết - sử dụng đăng ký tự động "ngay lập tức", yêu cầu chọn preset đã cấu hình trong tham số SE::Yandex::Register preset. Only from "accounts.txt" - chỉ sử dụng các tài khoản hiện có từ accounts.txt, nếu hết - đợi thời gian đã định (tham số Wait new accounts in "accounts.txt") để xuất hiện tài khoản mới |
| Wait new accounts in "accounts.txt" | 0 | Thời gian chờ xuất hiện tài khoản mới trong accounts.txt |
| Remove bad accounts | Always, except wrong login/password | Tự động xóa các tài khoản "xấu": Always - luôn xóa. Always, except wrong login/password - luôn xóa, ngoại trừ trường hợp Yandex thông báo sai tên đăng nhập/mật khẩu. Thực tế là Yandex có thể đưa ra thông báo như vậy khi chặn IP đối với một tài khoản hoàn toàn hoạt động bình thường, vì vậy tùy chọn có thể giữ lại các tài khoản đó để sử dụng lại. Never - không bao giờ xóa. Bất kể tùy chọn nào được chọn, tài khoản sẽ không bị xóa khi gặp lỗi proxy/trình duyệt |
| SE::Yandex::Register preset | default | Lựa chọn preset cài đặt cho SE::Yandex::Register |
| Authorization method | HTTP | Phương thức xác thực: HTTP - nhanh, ít tốn tài nguyên. Chrome - chậm, tốn tài nguyên, về lý thuyết có thể kéo dài tuổi thọ tài khoản |
| Chrome headless | ☑ | Nếu tùy chọn này được bật, trình duyệt sẽ không hiển thị |
| Use sessions | ☑ | Sử dụng phiên làm việc |
| Do not reset session if authorization passed | ☑ | Không đặt lại phiên khi gặp lỗi nếu công cụ cào dữ liệu đã xác thực thành công |
| Use Wordstat 2 | ☐ | Sử dụng Wordstat 2 |
| Wordstat 2 parse all table data | ☑ | Cho phép tải ngay lập tức tất cả 2000 kết quả cho một truy vấn mà không cần duyệt qua phân trang |
