Chuyển đến nội dung chính

Các tùy chọn bổ sung cho một số công cụ cào dữ liệu

Một số công cụ cào dữ liệu hỗ trợ các tùy chọn bổ sung, có thể được thêm thông qua menu ngữ cảnh của cài đặt.

Tùy chọn bổ sung cho công cụ cào dữ liệu

Cào tất cả kết quả / Parse all results

Tùy chọn này khả dụng cho các công cụ cào dữ liệu SE::GoogleSE::Google, SE::YandexSE::Yandex, SE::BingSE::Bing, SE::YahooSE::Yahoo và cho phép vượt qua giới hạn hiển thị 1000 kết quả cho một truy vấn:

  • Khi cào dữ liệu truy vấn, A-Parser đánh giá số lượng kết quả trong kết quả tìm kiếm mà Google hoặc Yandex hiển thị
  • Tùy thuộc vào số lượng kết quả, công cụ cào dữ liệu sẽ thêm nhiều truy vấn bổ sung, từ đó cho phép cào được nhiều kết quả hơn (thường là tất cả) cho một truy vấn

Cào đến cấp độ / Parse to level

Tùy chọn này có sẵn cho các công cụ cào dữ liệu gợi ý (ví dụ SE::Google::SuggestSE::Google::Suggest), cho công cụ cào dữ liệu SE::Yandex::WordStatSE::Yandex::WordStat và cho công cụ cào dữ liệu liên kết HTML::LinkExtractorHTML::LinkExtractor:

  • Đối với các công cụ cào từ khóa gợi ý và Wordstat, nó sẽ chèn lại các từ khóa đã cào vào truy vấn, từ đó cho phép cào tất cả các từ khóa lồng nhau cho đến cấp độ được chỉ định
  • Đối với công cụ cào dữ liệu HTML::LinkExtractorHTML::LinkExtractor, nó sẽ chèn lại tất cả các liên kết nội bộ của trang web vào truy vấn, cho phép thu thập toàn bộ trang web và lập sơ đồ liên kết
ghi chú

Đối với tùy chọn này, bắt buộc phải bật khử trùng lặp truy vấn, nếu không có thể xảy ra tình trạng công cụ cào dữ liệu sẽ cào đi cào lại cùng một từ khóa hoặc liên kết theo vòng lặp

Tùy chọn này cho phép chỉ định khả năng cào dữ liệu theo chiều sâu dựa trên các từ khóa liên quan. Được hỗ trợ bởi các công cụ cào dữ liệu SE::GoogleSE::Google, SE::BingSE::Bing, SE::YahooSE::Yahoo.

Các tùy chọn khác

Có một số tùy chọn bổ sung cho các công cụ cào dữ liệu khác nhau, bạn có thể tìm hiểu thêm về mục đích của chúng trong tài liệu của từng công cụ cào dữ liệu:

  • Use Pages, Check Content, Check Next Page - các tùy chọn cho công cụ cào dữ liệu Net::HTTPNet::HTTP
  • Parse People also ask - tùy chọn cho công cụ cào dữ liệu SE::GoogleSE::Google