SE::Google::TrustCheck - 检查网站信任度
爬虫工具概览
该爬虫工具允许检查 Google 中的网站信任度。支持
SE::Google 爬虫工具的所有功能。
得益于 A-Parser 的多线程工作机制,请求处理速度可达每分钟 900 次,平均每分钟可获取多达 6200 条结果。

A-Parser 的功能允许保存数据抓取设置以便后续使用(预设)、设置数据抓取计划等等。
由于内置了强大的 Template Toolkit 模板引擎,结果可以按您需要的形式和结构进行保存,该引擎允许对结果应用额外的逻辑,并以各种格式输出数据,包括 JSON、SQL 和 CSV。
采集的数据
- 检查 Google 对网站的 Trust(信任度)
- 可能的结果 -
0、1和2:0- 无额外链接块1或2表示 Google 对该网站有信任度,因为它显示了额外的链接块。1- 表示网站有水平链接块,而2- 表示它有一个大的垂直链接块

功能
- 采集高权重网站数据库
- 支持选择搜索国家、域名、结果语言及其他设置
查询
查询时需要指定目标网站的 URL,例如:
http://uraldekor.ru/
http://a-parser.com/
http://www.yandex.ru/
http://google.com/
http://vk.com/
http://facebook.com/
http://youtube.com/
查询占位符
您可以使用 内置宏 自动从文件中替换子查询,例如我们想根据关键词库检查网站,指定几个主要查询:
ria.ru
lenta.ru
rbc.ru
yandex.ru
在查询格式中指定从 Keywords.txt 文件替换额外词汇的宏,此方法允许根据关键词库检查网站库并获得排名结果:
$query {subs:Keywords}
该宏将为每个原始搜索查询创建与文件中数量相同的额外查询,宏运行后的结果总数为 [原始查询数量(域名)] x [Keywords 文件中的查询数量] = [总查询数量]。
还可以在查询格式中指定协议,以便仅使用域名作为查询:
http://$query
此格式将为每个查询添加 http://。
结果输出变体
得益于内置的 Template Toolkit 模板引擎,A-Parser 支持灵活的结果格式化,使其能够以任意形式以及结构化形式(如 CSV 或 JSON)输出结果。
导出信任度检查列表
结果格式:
$query: $trustrank\n
结果中将显示链接列表及其 Trust 检查结果。
结果示例:
http://www.yandex.ru/: 2
http://a-parser.com/: 1
http://vk.com/: 2
http://uraldekor.ru/: 0
http://google.com/: 2
...
链接 + 锚点 + 描述及排名输出
将链接、锚点和描述输出到 CSV 表格
保存相关关键词
关键词竞争度
检查链接收录情况
以 SQL 格式保存
将结果转储为 JSON
结果处理
A-Parser 允许在数据抓取过程中直接处理结果,在本节中,我们列出了 SE::Google::TrustCheck 爬虫工具最常用的案例。
保存信任度值为 "1" 的域名
添加过滤器,并在下拉列表中选择信任度变量 $trustrank - Trust rank。选择类型:String equal。接着在String (字符串)中填写我们需要的信任度值 1。通过这种过滤器,您可以剔除所有不需要的信任度结果。

下载示例
eJx1VEtz2jAQ/iuMJod2hjhw6MU3woROOzSkCTkBB4HXRLWsNXrwGA//vSvZ2CYt
J3tf37f7raSSWW4y86LBgDUsXpSsCP8sZm9PcfwdcSshjufaGTv+gE3Wu+8FQ3OV
9VIhLWjWZwXXBrQHWNyoo6QEUu6kZf2S2VMBRIF70FokQEGRkJ2izrmlBkIa23Pp
fNrdzoE+xb07e2FeLhU738YpNB5PGqwWYDo4w8Fg0C1r2q8ZY9YQkLOKzqtU2Dku
u1D0j4UVqMgwoAw7r1YXIDMJc/jOi2FUC9oE3/ge5ljRQ+uekPXM8zBvwi34aFQJ
8uVrZI8egSeJ8JxcVgxe8Jb1XYldaE4h5XrNaPyJxtwPBgEgCHnpbsE+rC3ih4dK
X0ZILkD8rkpZnHJpoM8MdTzh1E/yOSJIIW5Rz4IU5C8ZqpGUU9iDbNMC/qMTMqFD
Mkqp6Edd+P+U2T8Y52bKLhWt/aCphwYlWI+zX21VglPckgDJmsaXIheWbDNGp/x+
BuTMAIpGumcvXY4aGpoauWanm1KA8mes3dyoaF1XY1xt59q5QZWK7aw+t5dMp+Z0
HWdqjHkhwc+lnJS0FgOv7SkZmXoN3mgb/Fw8DhR+9Mu9YxZRmp9vVauFFnQKv/kG
c1Kyy1pDbriU76/TboS1J4sMpznNlKGOtFsqfl89A9EG86U6HA7RiasEjiG4DS9C
Fdpn1TflG1gj1tYJnXXrkMI8t4Ut0qkkZc6r5oVpXqry1jsTl2da+x/zUhV4jXw6
+UhsEy7s8PwXfU7A2Q==
另请参阅:结果过滤器
链接去重
按域名进行链接去重
提取域名
删除锚点和描述中的标签
按包含内容过滤链接
可能的设置
支持
SE::Google 爬虫工具的所有设置,此外还包括:
| 参数名称 | 默认值 | 描述 |
|---|---|---|
| Pages count | 1 | 抓取搜索结果的页数(1 到 10) |