SE::Yandex::Suggest - Yandex 搜索建议爬虫工具
爬虫工具概览
Yandex 关键词搜索建议爬虫工具。得益于 SE::Yandex::Suggest 爬虫工具,您可以根据查询自动从 Yandex 搜索引擎的建议中收集关键词库。使用 SE::Yandex::Suggest 爬虫工具,可以根据地区轻松快速地抓取 Yandex 搜索建议。
Yandex 搜索建议爬虫工具解决了 SEO 的核心任务之一,即快速自动获取扩展的语义词库。Google 搜索建议可以覆盖最大数量的短语,结合 Yandex 关键词爬虫工具
SE::Yandex::WordStat,您将获得最完整的语义,从而吸引更多自然流量。
得益于 A-Parser 的多线程工作,查询处理速度可达每分钟 5700 次,平均每分钟可获取多达 17000-18000 条结果。

您可以使用自动查询扩展、从文件中替换子查询、遍历数字字母组合和列表,以获取尽可能多的结果。使用结果过滤,您可以立即清洗结果,删除所有不需要的垃圾内容(使用否定词)。
A-Parser 的功能允许保存 SE::Yandex::Suggest 爬虫工具的数据抓取设置以供将来使用(预设),设置数据抓取计划等等。
由于内置了强大的模板引擎 Template Toolkit,结果保存可以采用您需要的任何形式和结构,这允许对结果应用额外的逻辑并以各种格式输出数据,包括 JSON、SQL 和 CSV。
采集数据
- 每个查询的结果数量
- 查询建议
- 选择第 2 种查询方式时,还会采集额外数据和建议类型

应用场景
- 收集关键词库
查询
应将搜索短语指定为查询,例如:
外汇
写摘要
在线摘要
在莫斯科买车
新闻
查询替换
您可以使用内置宏自动从文件中替换子查询,例如,我们想为每个查询添加一组其他单词,指定几个主要查询:
essay
article
thesis
在查询格式中,指定从文件 Keywords.txt 替换额外单词的宏,此方法可以成倍增加查询的多样性:
{subs:Keywords} $query
该宏将为每个原始搜索查询创建与文件中相同数量的额外查询,宏运行的结果将是 [原始查询数量(域名)] x [Keywords 文件中的查询数量] = [总查询数量]。
例如,如果 Keywords.txt 文件包含:
buy
cheap
最终,替换宏将把 3 个主要查询变为 6 个:
buy essay
cheap essay
buy article
cheap article
buy thesis
cheap thesis
结果输出示例
得益于内置的模板引擎 Template Toolkit,A-Parser 支持灵活的结果格式化,使其能够以任意形式以及结构化形式(如 CSV 或 JSON)输出结果。
导出建议列表
结果格式:
$results.format('$suggest\n')
结果示例:
免费在线摘要
在线摘要订购
在线摘要免费下载
在线摘要下载
在线制作摘要
在线做摘要
在线查找摘要
在线免费制作摘要
在线订购摘要
输出查询、找到的建议总数、查询建议
结果格式:
$query - $totalcount:\n$results.format('$suggest\n')
结果示例:
在线摘要 - 10:
在线摘要
免费在线摘要
在线摘要订购
在线摘要免费下载
在线摘要下载
在线制作摘要
在线做摘要
在线查找摘要
在线免费制作摘要
在线订购摘要
输出到 CSV 表格
内置工具 $tools.CSVLine 允许创建正确的表格文档,以便导入 Excel 或 Google 表格。
结果格式:
[% FOREACH i IN results;
tools.CSVline(i.suggest);
END %]
文件名:
$datefile.format().csv
起始文本:
建议
在通用结果格式中,应用 Template Toolkit 模板引擎在 FOREACH 循环中输出 results 数组的 suggest 元素。
在结果文件名中,只需将文件扩展名更改为 csv 即可。
为了使“Prepend text”选项在任务编辑器中可用,需要激活“More options”。 在“Prepend text”中,用逗号分隔记录列名,并将第二行留空。
关键词竞争度
以 SQL 格式保存
结果格式:
[% FOREACH results;
"INSERT INTO serp VALUES('" _ query _ "', '"; suggest _ "')\n";
END %]
结果示例:
INSERT INTO serp VALUES('在线论文', '在线论文')
INSERT INTO serp VALUES('在线论文', '免费在线论文')
INSERT INTO serp VALUES('在线论文', '在线论文订购')
INSERT INTO serp VALUES('在线论文', '在线论文免费下载')
INSERT INTO serp VALUES('在线论文', '在线论文下载')
INSERT INTO serp VALUES('在线论文', '在线论文制作')
INSERT INTO serp VALUES('在线论文', '做在线论文')
INSERT INTO serp VALUES('在线论文', '查找在线论文')
...
将结果转储为 JSON
通用结果格式:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.totalcount = p1.totalcount;
obj.suggests = [];
FOREACH item IN p1.serp;
obj.suggests.push(item.suggest);
END;
obj.json %]
起始文本:
[
结束文本:
]
结果示例:
[{"suggests":["在线摘要","免费在线摘要","在线摘要订购","在线摘要免费下载","在线摘要下载","在线制作摘要","在线做摘要","在线查找摘要","在线免费制作摘要","在线订购摘要"],"totalcount":10}]
为了使“Prepend text”和“Append text”选项在任务编辑器中可用,需要激活“More options”。
结果处理
A-Parser 允许在数据抓取过程中直接处理结果,在本节中,我们列出了 SE::Yandex::Suggest 爬虫工具最常用的案例
爬取深度 (Parse to level) 选项
该选项指示爬虫工具将获取的结果按深度代入查询队列,直到指定的层级,例如:
- 如果指定为第 1 级,则爬虫工具会将从原始查询中获得的所有结果添加到查询中
- 如果指定为第 2 级,则爬虫工具会将从原始查询获得的所有结果 + 从第 1 级查询获得的所有结果添加到查询中
- 依此类推
简单来说,这就是将获取的结果代入查询队列,从而可以抓取更多结果。 由于结果中可能会有重复,为了让爬虫工具不进行多余的工作(不重复抓取相同内容),建议开启查询去重 (Unique queries)

下载示例
eJx1VFtv2jAU/iuVhdRVQggKfVjeKCrSJtZ0pX2YgAe3Pom8OrZnO6woyn/vsRPi
wLoXy+f2nct37Io4at/sgwELzpJkUxEd7iQhDDJaCkeGRFNjwXjzhqzvkuQXlQze
k2Rd5jlY79H5VsQdNGC02oMxnAEaOUM5U6agDrEbyD0VpXcbNBo7auxfLge2Ad1u
5eUVqXuA2nEl7REv1LSCPYiINhnX/y9AmOh4PZnWu92QtMmXIbevRk9Gbf+dcU33
8KR8B1xAVC9RuqdF6IFRB956bOJq5N49AmWM+6KpaDL4Ccasz5L/CTOQCn3xajjY
pVEFqhwEAK88HKvbkEGQCUKUIfZnE0OSjAoLQ2Kx1CXFQti5hTsw1CmTtkNMKqLk
XIgwwOgW8G9LLhjSPc8w6Fsb+LlL+g9G3bXXT4VU/DVYQ4cSpNv0R4xiaqXy4zAE
L7hD2S5UKT0xY1S+AehuZvferVAGujQtcpsdN1qD9LxHyuY6qk7aOKHlVPmqZMbz
tN2lo2cpn/DZpHKhCi3A9yVLIZAWC49xPea2pcELscDz4EVIcfLgnFLCfl83pWrD
cf1ufIEFTrKftYV8pUI8P676Fh9ondKpvDPmjL6wGGRbjmezsT+nN+E+690bfThn
1+F8uQgqCCcL50t0mn5t9TIwewHW0gPxlTnIFe4szq3edT9J999Un/4nSVXjRvy2
D423H5/3RR3yYJFufOr1Bxh5omw=
结果过滤(使用否定词)
使用否定词可以立即剔除您不需要的结果。 同样,使用过滤器可以仅保留包含所需关键词的结果。

下载示例
eJx1VN9vGjEM/leqCKmrVCEoIG33RlGRNrHSFfowAQ+BMyxrLrklOVbE7n+f44S7
g3UvUWx/tr/4R47McftqnwxYcJYliyPL6c4SlsKWF9KxW5ZzY8F484LNHpLkO1cp
vCXJrNjtwHpEhT0yd8gBvfUejBEpoFGkKG+1ybjD2CHknsvCw1pBY9vB/uG6ZUPQ
5VJd37CyETB3Qit7ikecJrAHWUfrdsr/E5CmBt51ew3kVkgH3hrZJYt488kiHba6
jbh5cDKgtEPGmx+N1yyLTr/f92fvI51r0mzovvlDQpeEAd07DWi4rwnUu2sY+rVD
z78mFAKzsXK1OpG2Y6qfr2jebcceVsYZ38Nch6dCrR6j9Mgz6kPKHXjrqRE3bffm
I/A0FT4flyGDn4I664sSv+jlSiMWr0aAHRudocoBBfDKw4ndgrVI9uUsyPdb8GHJ
lksLWG+kOuZIJL20CCw+d9pM4yAkR6bVUEoaghpG8e8LIVMc2eEWnT5Hx/ch039i
lNXzmqlwnH4b5FBFIel++rX2SvVE707FkCITDmU70oXyjemg8hUgr2r26GGZNlCl
iZFjdtzKHJSf3bplw7xWnT3jrC3nyo1WW7Gbxn04IQs1x9WfqpHOcgn+XaqQEtti
4bkej6GNbfBCTfDSeUQpzj4Np7W0X2aBam4Ejt/AE8ywks2sMeSGS/nyPGlavKN1
Op+qB2Mu2keDwRpLNGjsXnO56OzTPvXXV2GJ6EzrBY279ynqFXX2CqzlB+aZOdhp
nFmsW7mqfsPqzzy++ycmxxIn4qd9CmhfPo9FHfbB0gJ3y7/kMN7o
另请参阅:结果过滤器
可用设置
| 参数名称 | 默认值 | 描述 |
|---|---|---|
| Region | 俄罗斯 | 选择进行搜索的地区 |
| Request method | Method 1 | 查询方式:Method 1 - 旧方法,与以前相同;Method 2 - 新方法,允许收集所有扩展建议(广告、事实、网站链接) |