跳转到主要内容

SE::Google::Position - 在 Google 中检查网站关键词排名

爬虫工具概览

用于在谷歌中按关键词检查网站排名的爬虫工具。借助 SE::Google::Position 爬虫工具,您可以利用自己的域名库自动检查谷歌搜索结果中的排名。使用 SE::Google::Position 爬虫工具,可以轻松、准确且快速地确定网站在谷歌中的排名。

A-Parser 的功能允许保存 SE::Google::Position 爬虫工具的数据抓取设置以便日后使用(预设),设置数据抓取计划等等。您可以从文件中自动替换子查询。

由于内置了强大的 Template Toolkit 模板引擎,可以将结果保存为您需要的任何形式和结构,该引擎允许对结果应用额外的逻辑,并以各种格式输出数据,包括 JSON、SQL 和 CSV

爬虫工具应用案例

采集的数据

  • 网站排名和网站页面链接
  • 网站所有排名和页面链接的列表
采集的数据

功能

  • SE::GoogleSE::Google 爬虫工具的所有功能
  • 找到网站后自动停止数据抓取
  • 支持子域名搜索
  • 可以按域名、主域名和完整链接比较目标排名
  • 一次性采集多个域名的排名

使用场景

  • 检查自己网站和竞争对手网站的排名
  • 寻找网站的流量页面

查询

在查询中需要指定目标网站的域名和搜索词,中间用空格分隔,例如:

lenta.ru 新闻
lenta.ru 在线新闻

如果需要按查询列表检查一个网站,可以按查询格式 (Query format) 指定域名:

lenta.ru $query

或者直接使用关键词列表。要在查询中同时使用多个域名,需要指定以逗号分隔的域名列表,然后空格加关键词,例如:

lenta.ru,ria.ru,notfound.com 新闻 列表

结果将记录在数组 $bulkcheck 中。 同时也支持 Stop when found 选项,如果所有域名都找到了排名,数据抓取将结束。

查询占位符

您可以使用 内置宏 从文件中自动替换子查询,例如我们想根据关键词库检查网站/站点,指定几个主要查询:

ria.ru
lenta.ru
rbc.ru
yandex.ru

在查询格式中指定从 Keywords.txt 文件替换额外词汇的宏,此方法允许根据关键词库检查网站库并获得排名结果:

$query {subs:Keywords}

该宏将为每个原始搜索查询创建与文件中相同数量的额外查询,宏运行后的结果总数为 [原始查询数量(域名)] x [Keywords 文件中的查询数量] = [总查询数量]

结果输出选项

得益于内置的 Template Toolkit 模板引擎,A-Parser 支持灵活的结果格式化,这使其能够以任意形式以及结构化形式(如 CSV 或 JSON)输出结果。

导出排名列表

获取如下形式的结果:

目标域名 - 关键词: 搜索结果中的排名编号

结果格式:

$domain - $key: $position\n

结果示例:

lenta.ru - 新闻: 6
lenta.ru - 在线新闻: 7
...

同时检查多个域名(批量检查)

同时检查多个域名时,所有域名的信息都包含在 $bulkcheck 数组中。

结果格式:

$bulkcheck.format('$domain - $position\n')

查询示例:

lenta.ru,ria.ru,notfound.com 新闻 列表

结果示例:

lenta.ru - 1
ria.ru - 3
notfound.com - 0

与 SE::Google 相同。

与 SE::Google 相同。

与 SE::Google 相同。

关键词竞争程度

与 SE::Google 相同。

检查链接收录情况

与 SE::Google 相同。

以 SQL 格式保存

与 SE::Google 相同。

将结果转储为 JSON

与 SE::Google 相同。

结果处理

A-Parser 允许在数据抓取过程中直接处理结果,在本节中,我们列出了 SE::Google::Position 爬虫工具最受欢迎的案例

保存非零排名的域名

以同时检查多个域名的示例为基础(见上文结果输出选项)并添加了过滤器。

添加过滤器并在下拉列表中选择排名输出变量。选择类型:>。然后在Number (数字)中填写 0。通过这种过滤器,您可以排除所有排名为零的结果。

下载示例

如何将示例导入 A-Parser

eJx1VNtu2zAM/RVDCNAVyIJ2a4HBDwPSYhk2ZE3Wy1OaB9WiUy2y6Ely2szwv4+S
ZTvtuhdZJA/Jw4tcM8ft1i4NWHCWpaualeHOUnbzJU2/Im4UpOkSrXQSdfI+ueE7
SAQWXGqbPEn3iJVLePIHDCZlhLExK7mxYHzI1ZuRCCIg55VybFwzty+BUuIOjJEC
yCgFyTmagjsiFGBsx1XlYaOHSm2zR8i2kxbx7mjUMiJ+o47E/b0+OmbN/6NXFkqD
z/shcs6VhQOPXCoHhuyRQrpifWpfY1fLehyht63f5wOyJ3THMsBSZkFb1qzXXUQ7
C/x9TeXpJLa+N/pW32LLAwb1jKQrXoROCO7AW7tGHE/cs4/AhQjUuGoz+EEMWe+0
/B3IaSQsXY0EOzNYkMpBCOCV+47dio2C7Autgu/P1ie2bMwsUZ1xIiJeWyS1hTs0
i9AD0tcM9VSpOexADbAQ/6KSStDWTHNy+hYd34Ys/onR9OUdpqKZPxni0EcJ0sXi
x+AlcI4bqlw8UN1KFtKRbC+x0i7ObwtQ9j278j0r0ECfJkaO2ekxlaD9gg0jm5aD
6kUZL8byUpmhzuVmEZe2Q1b6ll7sQl9iUSrwdelKqbFf5uthPaY2jsELA8HXzpch
hS+9e4rMISr7/aalWhpJ63fuCRbUycOsMWTGlbq7nh9a2LBSJCjQjk9MNTYyfDS6
nDorJhkWyX11cvZRhBPC+WG4n52Gs9V8aqEP4Twf3KLZzyijl7BB2lHqU7Puf0D9
r61++zeU1g2twC+7bOG+Xx5MOmq8DYjT5i+HCcki
提示

另请参阅:结果过滤器

与 SE::Google 相同。

与 SE::Google 相同。

提取域名

与 SE::Google 相同。

从锚点和摘要中删除标签

与 SE::Google 相同。

与 SE::Google 相同。

可选设置

支持 SE::GoogleSE::Google 爬虫工具的所有设置,此外还包括:

参数名称默认值描述
Pages count1搜索结果抓取的页数(从 1 到 10)
Result format$domain - $key: $position\n默认结果输出格式
Stop when found如果找到域名则停止数据抓取,不再跳转到后续页面
Match typeExact domain可以按域名、主域名和完整链接比较目标排名 (Exact domain / Top level domain / Exact url)