跳转到主要内容

SEO::Ping - 向支持 Weblog API 的服务(Google Blog Search、Feed Burner、Ping-o-Matic 等)批量发送 Ping 请求

爬虫工具概览

爬虫工具概览SEO::PingSEO::Ping – 允许向支持 Weblog API (http://www.weblogs.com/api.html) 的服务发送 Ping 请求,以通知网站\博客中出现了新页面:如 Google Blog Search、Feed Burner、Ping-o-Matic 等。

A-Parser 的功能允许保存 SEO::Ping 爬虫工具的抓取设置以便后续使用(预设),设置数据抓取计划等等。

得益于内置强大的模板引擎 Template Toolkit,可以将结果保存为您需要的任何形式和结构,该引擎允许对结果应用额外的逻辑,并以各种格式输出数据,包括 JSON、SQL 和 CSV

应用场景

  • 批量索引网站和博客页面

查询

支持两种查询选项:简化格式和完整格式。

简化格式

通过空格指定以下参数:

  • 接收 Ping 请求的 Ping 服务地址
  • 网站地址
  • 待索引的网站页面链接
  • 网站或博客名称
http://rpc.weblogs.com/RPC2 http://a-parser.com/ http://a-parser.com/wiki/seo-ping A-Parser - 专业的 SEO 爬虫工具

完整格式

通过空格指定:

  • 接收 Ping 请求的 Ping 服务地址
  • JSON 格式的字符串,包含被 Ping 网站的描述
http://ping.feedburner.com {"name":"A-Parser - 专业的 SEO 爬虫工具", "site":"http://a-parser.com/", "page":"http://a-parser.com/wiki/seo-ping", "feed":"http://a-parser.com/feed", "tags":"parser|爬虫工具"}

在完整格式中可以指定额外参数,例如:

  • 网站的 RSS feed 地址
  • 描述网站所属类别的标签

除 name 和 site 外,所有参数均为可选

向多个服务批量发送请求

要向多个服务批量发送多个页面,可以利用 Query format 中的宏功能:

  • 将服务列表放入文件 queries/subs/ping-services.txt
  • 将待索引的链接列表放入文件 queries/subs/site-links.txt

那么最终的查询可以这样指定:

{subs:ping-services} http://a-parser.com/ {subs:site-links} A-Parser - 专业的 SEO 爬虫工具

爬虫工具将自动创建查询,并将 site-links.txt 文件中的每个链接发送到 ping-services.txt 文件中的每个服务。

结果输出示例

得益于内置的模板引擎 Template Toolkit,A-Parser 支持灵活的结果格式化,这使其能够以任意形式以及结构化形式(例如 CSV 或 JSON)输出结果。

默认输出

结果格式:

$service: $message\n

结果示例:

http://rpc.weblogs.com/RPC2: Thanks for the ping.

Ping 请求是否成功应根据以下参数确定:

  • $success = 1 - 请求已成功发送并收到响应
  • $flerror = 0 - Ping 服务接受了请求且无错误

可能的设置