Tổng quan và ứng dụng
Danh sách theo chủ đề của tất cả các công cụ cào dữ liệu tích hợp sẵn trong A-Parser kèm theo mô tả và liên kết đến trang của chúng.
Công cụ cào dữ liệu công cụ tìm kiếm
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
SE::Google | Cào tất cả dữ liệu từ kết quả tìm kiếm Google: liên kết, anchor, snippet, Related keywords, cào các khối quảng cáo. Đa luồng, vượt ReCaptcha |
SE::Yandex | Cào tất cả dữ liệu từ kết quả tìm kiếm Yandex: liên kết, anchor, snippet, Related keywords, cào các khối quảng cáo. Độ sâu cào dữ liệu tối đa |
SE::AOL | Cào tất cả dữ liệu từ kết quả tìm kiếm AOL: liên kết, anchor, snippet |
SE::Bing | Cào tất cả dữ liệu từ kết quả tìm kiếm Bing: liên kết, anchor, snippet, Related keywords, Độ sâu cào dữ liệu tối đa |
SE::Baidu | Cào tất cả dữ liệu từ kết quả tìm kiếm Baidu: liên kết, anchor, snippet, Related keywords |
SE::Baidu | Cào tất cả dữ liệu từ kết quả tìm kiếm Baidu: liên kết, anchor, snippet, Related keywords |
SE::Dogpile | Cào tất cả dữ liệu từ kết quả tìm kiếm Dogpile: liên kết, anchor, snippet, Related keywords |
SE::DuckDuckGo | Cào tất cả dữ liệu từ kết quả tìm kiếm DuckDuckGo: liên kết, anchor, snippet |
SE::Seznam | Công cụ cào dữ liệu hệ thống tìm kiếm Séc seznam.cz: liên kết, anchor, snippet, Related keywords |
SE::Yahoo | Cào tất cả dữ liệu từ kết quả tìm kiếm Yahoo: liên kết, anchor, snippet, Related keywords, Độ sâu cào dữ liệu tối đa |
SE::Youtube | Cào dữ liệu từ kết quả tìm kiếm Youtube: liên kết, tiêu đề, mô tả, tên người dùng, liên kết ảnh xem trước, số lượt xem, độ dài video |
SE::Ask | Công cụ cào dữ liệu kết quả tìm kiếm Google Mỹ thông qua Ask.com: liên kết, anchor, snippet, Related keywords |
SE::Rambler | Cào tất cả dữ liệu từ kết quả tìm kiếm Rambler: liên kết, anchor, snippet |
SE::Startpage | Cào tất cả dữ liệu từ kết quả tìm kiếm Startpage: liên kết, anchor, snippet |
Ví dụ
🔗 Lập chỉ mục trang trên Google và Yandex
Lập chỉ mục trang trên Google và Yandex
🔗 Video Cào dữ liệu các tên miền theo chủ đề theo cụm từ khóa từ Google
Video Cào dữ liệu các tên miền theo chủ đề theo cụm từ khóa từ Google
🔗 Câu hỏi và câu trả lời từ kết quả tìm kiếm Google
Câu hỏi và câu trả lời từ kết quả tìm kiếm Google
🔗 Cào dữ liệu các tên miền theo chủ đề theo cụm từ khóa từ Google và lấy các thông số khác nhau của tên miền
Cào dữ liệu các tên miền theo chủ đề theo cụm từ khóa từ Google và lấy các thông số khác nhau của tên miền
🔗 Cào dữ liệu Google News kèm ngày tháng và chuyển đổi định dạng
Cào dữ liệu Google News kèm ngày tháng và chuyển đổi định dạng
🔗 Cào dữ liệu chỉ các đoạn trích (snippets) từ Google
Cào dữ liệu chỉ các đoạn trích (snippets) từ Google
🔗 Kiểm tra chính tả trong Google
Kiểm tra chính tả trong Google
🔗 Cào dữ liệu liên kết và văn bản neo (anchors) từ Google vào CSV
Cào dữ liệu liên kết và văn bản neo (anchors) từ Google vào CSV
🔗 Cào dữ liệu văn bản từ công cụ tìm kiếm Google sử dụng chuỗi tác vụ
Cào dữ liệu văn bản từ công cụ tìm kiếm Google sử dụng chuỗi tác vụ
🔗 Công cụ cào dữ liệu bộ nhớ đệm (cache) Yandex
Công cụ cào dữ liệu bộ nhớ đệm (cache) Yandex
🔗 Cào dữ liệu chỉ các đoạn trích (snippets) từ Yandex
Cào dữ liệu chỉ các đoạn trích (snippets) từ Yandex
🔗 Lấy kết quả tìm kiếm Yandex và vị trí của kết quả
Lấy kết quả tìm kiếm Yandex và vị trí của kết quả
🔗 Số lượng trang của website trong Yandex
Số lượng trang của website trong Yandex
🔗 Cào dữ liệu mức độ cạnh tranh theo từ khóa từ Yandex
Cào dữ liệu mức độ cạnh tranh theo từ khóa từ Yandex
🔗 Tìm kiếm các ngách còn trống trong phân khúc internet RU
Tìm kiếm các ngách còn trống trong phân khúc internet RU
Công cụ cào dữ liệu thứ hạng trên công cụ tìm kiếm
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
SE::Google::Position | Kiểm tra vị trí website theo từ khóa trong Google: liên kết, danh sách tất cả vị trí |
SE::Yandex::Position | Kiểm tra vị trí website theo từ khóa trong Yandex: liên kết, danh sách tất cả vị trí |
SE::Bing::Position | Kiểm tra vị trí website theo từ khóa trong Bing: liên kết, danh sách tất cả vị trí |
Ví dụ
🔗 Lấy vị trí website đồng thời cho nhiều khu vực
Lấy vị trí website đồng thời cho nhiều khu vực
🔗 Lấy vị trí website đồng thời cho nhiều khu vực
Lấy vị trí website đồng thời cho nhiều khu vực
🔗 Tổng quan về các tùy chọn hiển thị kết quả
Tổng quan về các tùy chọn hiển thị kết quả
Công cụ cào dữ liệu gợi ý tìm kiếm
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
SE::Google::Suggest | Công cụ cào gợi ý Google: số lượng kết quả theo truy vấn, gợi ý cho truy vấn, loại truy vấn |
SE::Yandex::Suggest | Công cụ cào gợi ý Yandex: số lượng kết quả theo truy vấn, gợi ý cho truy vấn |
SE::Bing::Suggest | Công cụ cào gợi ý Bing: số lượng kết quả theo truy vấn, gợi ý cho truy vấn |
SE::Aol::Suggest | Công cụ cào gợi ý Aol: số lượng kết quả theo truy vấn, gợi ý cho truy vấn |
SE::Yahoo::Suggest | Công cụ cào gợi ý Yahoo: số lượng kết quả theo truy vấn, gợi ý cho truy vấn |
SE::Youtube::Suggest | Công cụ cào gợi ý Youtube: gợi ý cho truy vấn |
Ví dụ
🔗 Mẫu để cào dữ liệu gợi ý tìm kiếm với khả năng loại trừ các gợi ý chứa từ khóa loại trừ
Mẫu để cào dữ liệu gợi ý tìm kiếm với khả năng loại trừ các gợi ý chứa từ khóa loại trừ
Công cụ cào dữ liệu từ khóa
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
SE::Google::Trends | Công cụ cào từ khóa đang thịnh hành theo Google |
SE::Yandex::WordCraft | Công cụ cào truy vấn người dùng và các trang web phổ biến trong tìm kiếm Yandex với Yandex Webmaster WordCraft |
SE::Yandex::Wordstat | Công cụ cào từ khóa và thống kê lượt hiển thị từ dịch vụ wordstat.yandex.ru |
SE::Yandex::Wordstat::ByDate | Công cụ cào thống kê lượt hiển thị Yandex WordStat theo tháng hoặc tuần, thống kê từ khóa |
Rank::Bukvarix::Domain | Thu thập từ khóa theo tên miền từ Bukvarix: từ khóa, tần suất, vị trí |
Rank::Bukvarix::Keyword | Thu thập từ khóa theo từ khóa từ Bukvarix: từ khóa, tần suất, vị trí |
Rank::Ahrefs::KeywordDifficulty | Độ khó từ khóa, từ khóa, số lượng từ khóa |
Rank::Ahrefs::KeywordGenerator | Thu thập từ khóa Ahrefs: ý tưởng từ khóa, câu hỏi chứa từ khóa |
SE::Google::KeywordPlanner | Thu thập gợi ý, từ khóa, cạnh tranh, giá thầu tối thiểu và tối đa |
SE::Yandex::Direct | Số lượng quảng cáo cho truy vấn cụ thể, tiêu đề, văn bản và tên miền, liên kết, anchor, thẻ |
Ví dụ
🔗 Tính thời vụ của từ khóa
Tính thời vụ của từ khóa
🔗 Đánh giá tần suất theo WordStat
Đánh giá tần suất theo WordStat
🔗 Cào dữ liệu Wordstat theo chiều sâu
Cào dữ liệu Wordstat theo chiều sâu
🔗 Lấy danh sách các danh mục Google Trends
Lấy danh sách các danh mục Google Trends
🔗 Định dạng ngày tháng Google Trends
Định dạng ngày tháng Google Trends
Đăng ký tài khoản
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
SE::Yandex::Register | Đăng ký tài khoản trong Yandex |
Ví dụ
🔗 Lấy danh sách đầy đủ các khu vực của Yandex
Lấy danh sách đầy đủ các khu vực của Yandex
🔗 Tự động hóa đăng ký tài khoản Yandex
Tự động hóa đăng ký tài khoản Yandex
Công cụ cào dữ liệu thông số trang web và tên miền
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
SE::Google::TrustCheck | Kiểm tra độ tin cậy (trust) của website |
SE::Google::Compromised | Kiểm tra sự hiện diện của dòng chữ This site may be hacked |
SE::Google::SafeBrowsing | Kiểm tra tên miền trong danh sách đen của Google |
SE::Yandex::SafeBrowsing | Kiểm tra tên miền trong danh sách đen của Yandex |
SE::Yandex::SQI | Kiểm tra Chỉ số chất lượng website trong Yandex |
Net::Whois | Xác định tên miền đã được đăng ký hay chưa, ngày tạo tên miền, cũng như ngày hết hạn đăng ký |
Net::Dns | Công cụ cào phân giải tên miền sang địa chỉ IP |
Rank::Cms | Xác định tất cả các diễn đàn, blog, CMS, guestbook, wiki phổ biến và nhiều loại mã nguồn khác |
Rank::Archive | Công cụ cào ngày lưu bộ nhớ đệm đầu tiên và cuối cùng của website trong kho lưu trữ web |
Rank::MajesticSEO | Công cụ cào số lượng backlink từ dịch vụ majesticseo.com |
Rank::Mustat | Đánh giá lưu lượng truy cập website, cũng như giá trị và xếp hạng tên miền |
Rank::Social::Signal | Công cụ cào tín hiệu mạng xã hội |
Rank::Curlie | Kiểm tra sự hiện diện của website trong danh mục Curlie (tương tự DMOZ) |
Rank::Ahrefs | Công cụ cào ahrefs.com |
Rank::KeysSo | Công cụ cào keys.so |
Rank::MOZ | Công cụ cào MOZ |
SecurityTrails::Ip | Thu thập tên miền theo IP |
SecurityTrails::Domain | Công cụ cào SecurityTrails |
Ví dụ
🔗 Cào dữ liệu các tên miền theo chủ đề theo cụm từ khóa từ Google và lấy các thông số khác nhau của tên miền
Cào dữ liệu các tên miền theo chủ đề theo cụm từ khóa từ Google và lấy các thông số khác nhau của tên miền
🔗 Thông tin về website
Thông tin về website
🔗 Net::Whois chọn dữ liệu tùy ý
Net::Whois chọn dữ liệu tùy ý
🔗 Nhận thông báo qua Telegram về việc hết hạn đăng ký tên miền
Nhận thông báo qua Telegram về việc hết hạn đăng ký tên miền
🔗 Thu thập cơ sở dữ liệu địa chỉ e-mail
Thu thập cơ sở dữ liệu địa chỉ e-mail
🔗 Xác định danh sách tên miền trên một IP
Xác định danh sách tên miền trên một IP
🔗 Xác định CMS cho 1.000.000 tên miền trong 15 giờ
Xác định CMS cho 1.000.000 tên miền trong 15 giờ
🔗 Cào dữ liệu tên miền website theo một CMS nhất định
Cào dữ liệu tên miền website theo một CMS nhất định
🔗 Các trang web wordpress có đăng ký
Các trang web wordpress có đăng ký
Công cụ cào dữ liệu các dịch vụ khác nhau
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
SE::Yandex::Register | Cho phép đăng ký tài khoản trong Yandex |
SE::Bing::Translator | Trình dịch thông qua dịch vụ www.bing.com/translator/ |
SE::Google::Translate | Trình dịch Google |
SE::Yandex::Translate | Trình dịch Yandex |
SE::Bing::Images | Công cụ cào hình ảnh từ công cụ tìm kiếm Bing |
SE::Google::Images | Công cụ cào hình ảnh theo từ khóa Google |
SE::Google::ByImage | Tìm kiếm hình ảnh theo liên kết |
SE::Yandex::Images | Công cụ cào hình ảnh theo từ khóa Yandex |
SE::Yandex::ByImage | Công cụ cào hình ảnh theo liên kết từ Yandex |
SE::DuckDuckGo::Images | Công cụ cào hình ảnh từ DuckDuckGo |
SE::Dogpile::Images | Công cụ cào hình ảnh từ Dogpile |
Util::AntiGate | Nhận dạng captcha thông qua dịch vụ AntiGate |
Util::YandexRecognize | Nhận dạng captcha từ Yandex |
Util::ReCaptcha2 | Nhận dạng recaptcha từ các tài nguyên Anti-captcha.com, Rucaptcha.com, Capmonster, Capmonster.cloud, Xevil, 2captcha, R.I.P.captcha |
SEO::Ping | Gửi hàng loạt yêu cầu Ping đến các dịch vụ hỗ trợ Weblog API (Google Blog Search, Feed Burner, Ping-o-Matic, v.v.) |
Check::RosKomNadzor | Kiểm tra website trong cơ sở dữ liệu của Roskomnadzor |
SE::Yandex::Speller | Kiểm tra lỗi văn bản trên trang thông qua Yandex.Speller |
GooglePlay::Apps | Công cụ cào ứng dụng Google Play |
Social::Instagram::Post | Công cụ cào dữ liệu về các bài đăng trên Instagram |
Social::Instagram::Profile | Công cụ cào dữ liệu từ hồ sơ trên Instagram |
Social::Instagram::Tag | Công cụ cào bài đăng theo thẻ trên Instagram |
Social::Instagram::Geo | Công cụ cào bài đăng trên Instagram tại vị trí chỉ định |
Telegram::GroupScraper | Công cụ cào dữ liệu từ các nhóm công khai trong Telegram |
API::Server::Redis | Làm việc với A-Parser thông qua Redis |
SE::Google::Cache | Kiểm tra sự hiện diện của trang trong bộ nhớ đệm Google |
Social::Instagram::Geo | Công cụ cào bài đăng trên Instagram tại vị trí chỉ định |
DeepL::Translator | Trình dịch văn bản thông qua dịch vụ www.deepl.com |
CoinMarketCap::LastPrice | Công cụ cào cửa hàng CoinMarketCap: tên token, giá hiện tại bằng USD |
Ví dụ
🔗 Tự động hóa đăng ký tài khoản Yandex
Tự động hóa đăng ký tài khoản Yandex
🔗 So sánh tốc độ của các trình dịch
So sánh tốc độ của các trình dịch
🔗 Sử dụng toàn bộ tệp làm truy vấn
Sử dụng toàn bộ tệp làm truy vấn
🔗 Tải tệp từ thư mục để dịch trong DeepL
Tải tệp từ thư mục để dịch trong DeepL
🔗 Tải xuống hình ảnh theo độ phân giải và kích thước chỉ định
Tải xuống hình ảnh theo độ phân giải và kích thước chỉ định
🔗 Tạo công cụ cào dữ liệu JS. Làm việc với CAPTCHA
Tạo công cụ cào dữ liệu JS. Làm việc với CAPTCHA
🔗 Tạo công cụ cào dữ liệu JS. Làm việc với ReCaptcha2
Tạo công cụ cào dữ liệu JS. Làm việc với ReCaptcha2
🔗 Ví dụ làm việc với SEO::Ping
Ví dụ làm việc với SEO::Ping
🔗 Công cụ cào dữ liệu liên kết địa điểm cho Social::Instagram::Geo
Công cụ cào dữ liệu liên kết địa điểm cho Social::Instagram::Geo
🔗 Cào dữ liệu thông tin về người dùng Instagram
Cào dữ liệu thông tin về người dùng Instagram
🔗 Cào dữ liệu người dùng các nhóm công khai trong Telegram
Cào dữ liệu người dùng các nhóm công khai trong Telegram
Công cụ cào dữ liệu cửa hàng
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
Shop::Amazon | Công cụ cào kết quả tìm kiếm amazon.com |
Shop::Yandex::Market | Công cụ cào Yandex.Market |
Shop::AliExpress | Công cụ cào kết quả tìm kiếm Shop::AliExpress |
Shop::eBay | Công cụ cào kết quả tìm kiếm Ebay |
Shop::Wildberries::ProductsList | Công cụ cào danh sách sản phẩm Wildberries |
Shop::Wildberries::ProductInfo | Công cụ cào trang sản phẩm Wildberries |
Shop::Wildberries::Suggest | Công cụ cào gợi ý tìm kiếm Wildberries |
Shop::Yandex::Market | Công cụ cào sản phẩm từ YANDEX.MARKET |
Ví dụ
🔗 Cào dữ liệu sản phẩm từ website
Cào dữ liệu sản phẩm từ website
Công cụ cào dữ liệu bản đồ
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
Maps::Google | Công cụ cào Google Maps: tên tổ chức, địa chỉ và tọa độ, xếp hạng, số lượng đánh giá và chính sách giá, website, điện thoại, ảnh |
Maps::Yandex | Công cụ cào Yandex Maps: tên tổ chức, địa chỉ và tọa độ, xếp hạng, số lượng đánh giá và chính sách giá, website, điện thoại, ảnh, mạng xã hội |
Ví dụ
🔗 Cào dữ liệu Google Maps để thu thập tất cả các tổ chức trong một khu vực nhất định
Cào dữ liệu Google Maps để thu thập tất cả các tổ chức trong một khu vực nhất định
Công cụ cào dữ liệu nội dung
| Tên công cụ cào dữ liệu | Mô tả |
|---|---|
Check::BackLink | Kiểm tra sự hiện diện của liên kết của bạn trong cơ sở dữ liệu liên kết |
HTML::LinkExtractor | Công cụ cào liên kết ngoại và nội bộ từ website chỉ định, có thể đi theo các liên kết nội bộ đến cấp độ đã chọn |
HTML::ArticleExtractor | Công cụ cào bài viết |
HTML::TextExtractor | Công cụ cào khối văn bản |
HTML::TextExtractor::LangDetect | Xác định ngôn ngữ của trang mà không cần sử dụng dịch vụ bên thứ ba |
HTML::EmailExtractor | Cào dữ liệu địa chỉ e-mail từ các trang web |
Net::HTTP | Tải xuống trang chỉ định, hỗ trợ cào dữ liệu nhiều trang |
Ví dụ
🔗 Kiểm tra xem có liên kết đến trang trong bộ nhớ đệm Yandex không
Kiểm tra xem có liên kết đến trang trong bộ nhớ đệm Yandex không
🔗 Cào dữ liệu website theo chiều sâu dựa trên công cụ cào dữ liệu HTML::LinkExtractor
Cào dữ liệu website theo chiều sâu dựa trên công cụ cào dữ liệu HTML::LinkExtractor
🔗 Video cào dữ liệu tài nguyên Booking.com sử dụng Net::HTTP
Video cào dữ liệu tài nguyên Booking.com sử dụng Net::HTTP
🔗 Kiểm tra định kỳ các liên kết ngược (backlinks) và ghi thêm kết quả vào bảng
Kiểm tra định kỳ các liên kết ngược (backlinks) và ghi thêm kết quả vào bảng
🔗 Cào dữ liệu website theo chiều sâu dựa trên công cụ cào dữ liệu HTML::LinkExtractor
Cào dữ liệu website theo chiều sâu dựa trên công cụ cào dữ liệu HTML::LinkExtractor
🔗 Thu thập các chủ đề được liên kết với nhau
Thu thập các chủ đề được liên kết với nhau
🔗 Tìm kiếm tên miền phụ (subdomains) của website
Tìm kiếm tên miền phụ (subdomains) của website
🔗 Cào dữ liệu website và lưu liên kết hình ảnh
Cào dữ liệu website và lưu liên kết hình ảnh
🔗 Tạo sitemap.xml sử dụng các tính năng của JavaScript
Tạo sitemap.xml sử dụng các tính năng của JavaScript
🔗 Lấy các trang của website và kiểm tra lập chỉ mục trong Google và Yandex
Lấy các trang của website và kiểm tra lập chỉ mục trong Google và Yandex
🔗 Phân tích tốc độ phản hồi của các trang trên website
Phân tích tốc độ phản hồi của các trang trên website
🔗 Cào dữ liệu e-mail từ các trang liên hệ
Cào dữ liệu e-mail từ các trang liên hệ
🔗 Kiểm tra độ dài văn bản trên các trang
Kiểm tra độ dài văn bản trên các trang
🔗 Chuyển tự (Transliteration)
Chuyển tự (Transliteration)




























































































