跳转到主要内容

SE::Yahoo::Suggest - Yahoo 搜索建议爬虫工具

Yahoo 搜索建议爬虫工具概览

Yahoo 搜索建议爬虫工具用于按关键词抓取 Yahoo 的搜索建议。Yahoo 建议爬虫工具解决了 SEO 的核心任务之一,即快速自动获取扩展语义库。借助 SE::Yahoo::Suggest 爬虫工具,您可以根据查询自动从 Yahoo 搜索引擎的建议中收集关键词库。使用 SE::Yahoo::Suggest 爬虫工具,可以根据所选域名轻松快速地抓取 Yahoo 查询建议。

得益于 A-Parser 的多线程工作能力,查询处理速度可达每分钟 7700 次,平均每分钟可获取多达 51000 条结果。

爬虫工具概览:运行速度

您可以使用查询自动扩展、从文件中插入子查询、循环遍历数字字母组合和列表,以获取尽可能多的结果。通过使用结果过滤,您可以立即清洗结果,删除所有不需要的垃圾内容(使用否定词)。

A-Parser 的功能允许保存 SE::Yahoo::Suggest 爬虫工具的数据抓取设置以供将来使用(预设),设置数据抓取计划等等。

由于内置了强大的模板引擎 Template Toolkit,结果可以按您需要的形式和结构进行保存,该引擎允许对结果应用额外的逻辑,并以各种格式输出数据,包括 JSON、SQL 和 CSV

采集数据

  • 每个查询的结果数量
  • 查询建议
采集数据

功能

  • 选择域名

应用场景

  • 收集关键词库

查询

应指定搜索短语作为查询,例如:

write essay
Football
Waterfall
Speak in english
Cats and dogs
forex
cheap essay

查询占位符

您可以使用内置宏自动从文件中插入子查询,例如,我们想为每个查询添加另一个单词列表,指定几个主要查询:

essay
article
thesis

在查询格式中指定从文件 Keywords.txt 插入额外单词的宏,此方法可以成倍增加查询的多样性:

{subs:Keywords} $query 

该宏将为每个原始搜索查询创建与文件中相同数量的附加查询,宏运行的结果总数为 [原始查询数量(域名)] x [Keywords 文件中的查询数量] = [总查询数量]

例如,如果 Keywords.txt 文件包含:

buy
cheap

最终,占位符宏将把 3 个主要查询转换为 6 个:

buy essay
cheap essay
buy article
cheap article
buy thesis
cheap thesis

结果输出示例

得益于内置的模板引擎 Template Toolkit,A-Parser 支持灵活的结果格式化,这使其能够以任意形式以及结构化形式(如 CSV 或 JSON)输出结果。

导出建议列表

与 SE::Google::Suggest 类似。

输出到 CSV 表格

与 SE::Google::Suggest 类似。

关键词竞争度

与 SE::Google 类似。

以 SQL 格式保存

结果格式:

[% FOREACH results;
"INSERT INTO serp VALUES('" _ query _ "', '"; suggest _ "')\n";
END %]

结果示例:

INSERT INTO serp VALUES('write essay', 'write essay for me')
INSERT INTO serp VALUES('write essay', 'write essay online')
INSERT INTO serp VALUES('write essay', 'write essay for you')
INSERT INTO serp VALUES('write essay', 'write essay free')
INSERT INTO serp VALUES('write essay', 'write essays')
INSERT INTO serp VALUES('write essay', 'write essay conclusion')
INSERT INTO serp VALUES('write essay', 'write essay on covid 19')
INSERT INTO serp VALUES('write essay', 'write essay today')
INSERT INTO serp VALUES('write essay', 'write essays for money')
INSERT INTO serp VALUES('write essay', 'write essay online for free')
...

将结果转储为 JSON

与 SE::Google::Suggest 类似。

结果处理

A-Parser 允许在数据抓取过程中直接处理结果,在本节中,我们列出了 SE::Yahoo::Suggest 爬虫工具最受欢迎的案例

抓取层级选项 (Parse to level)

与 SE::Google::Suggest 类似。

结果过滤(使用否定词)

与 SE::Google::Suggest 类似。

可能的设置

参数名称默认值描述
Yahoo domainsugg.search.yahoo.com选择 Yahoo 域名,允许选择搜索语言