概览与应用

A-Parser 中所有现有内置爬虫工具的按主题分类列表，包含说明及对应页面链接。

搜索引擎爬虫工具

爬虫工具名称	描述
SE::Google	抓取 Google 搜索结果的所有数据：链接、锚文本、摘要、相关关键词、广告位抓取。支持多线程，绕过 ReCaptcha
SE::Yandex	抓取 Yandex 搜索结果的所有数据：链接、锚文本、摘要、相关关键词、广告位抓取。最大抓取深度
SE::AOL	抓取 AOL 搜索结果的所有数据：链接、锚文本、摘要
SE::Bing	抓取 Bing 搜索结果的所有数据：链接、锚文本、摘要、相关关键词。最大抓取深度
SE::Baidu	抓取百度搜索结果的所有数据：链接、锚文本、摘要、相关关键词
SE::Baidu	抓取百度搜索结果的所有数据：链接、锚文本、摘要、相关关键词
SE::Dogpile	抓取 Dogpile 搜索结果的所有数据：链接、锚文本、摘要、相关关键词
SE::DuckDuckGo	抓取 DuckDuckGo 搜索结果的所有数据：链接、锚文本、摘要
SE::Seznam	捷克搜索引擎 seznam.cz 爬虫工具：链接、锚文本、摘要、相关关键词
SE::Yahoo	抓取 Yahoo 搜索结果的所有数据：链接、锚文本、摘要、相关关键词。最大抓取深度
SE::Youtube	抓取 Youtube 搜索结果数据：链接、标题、描述、用户名、预览图链接、观看次数、视频时长
SE::Ask	通过 Ask.com 抓取 Google 美国搜索结果：链接、锚文本、摘要、相关关键词
SE::Rambler	抓取 Rambler 搜索结果的所有数据：链接、锚文本、摘要
SE::Startpage	抓取 Startpage 搜索结果的所有数据：链接、锚文本、摘要

示例

🔗 Google 和 Yandex 页面收录查询

Google 和 Yandex 页面收录查询

🔗 视频：根据 Google 关键词抓取主题域名

视频：根据 Google 关键词抓取主题域名

🔗 Google 搜索结果中的问答数据抓取

Google 搜索结果中的问答数据抓取

🔗 根据 Google 关键词抓取主题域名并获取各项域名参数

根据 Google 关键词抓取主题域名并获取各项域名参数

🔗 抓取 Google 新闻日期并进行格式转换

抓取 Google 新闻日期并进行格式转换

🔗 仅从 Google 抓取搜索摘要 (Snippets)

仅从 Google 抓取搜索摘要 (Snippets)

🔗 Google 拼写检查

Google 拼写检查

🔗 将 Google 链接和锚文本抓取到 CSV

将 Google 链接和锚文本抓取到 CSV

🔗 使用任务链从 Google 搜索引擎抓取文本

使用任务链从 Google 搜索引擎抓取文本

🔗 Yandex 缓存爬虫工具

Yandex 缓存爬虫工具

🔗 仅从 Yandex 抓取搜索摘要 (Snippets)

仅从 Yandex 抓取搜索摘要 (Snippets)

🔗 获取 Yandex 搜索结果及排名位置

获取 Yandex 搜索结果及排名位置

🔗 Yandex 中的网站页面数量

Yandex 中的网站页面数量

🔗 从 Yandex 抓取关键词竞争程度

从 Yandex 抓取关键词竞争程度

🔗 在俄语 (RU) 互联网细分市场寻找空白利基

在俄语 (RU) 互联网细分市场寻找空白利基

搜索引擎排名爬虫工具

爬虫工具名称	描述
SE::Google::Position	在 Google 中按关键词检查网站排名：链接、所有排名位置列表
SE::Yandex::Position	在 Yandex 中按关键词检查网站排名：链接、所有排名位置列表
SE::Bing::Position	在 Bing 中按关键词检查网站排名：链接、所有排名位置列表

示例

🔗 同时获取多个地区的网站排名

同时获取多个地区的网站排名

🔗 同时获取多个地区的网站排名

同时获取多个地区的网站排名

🔗 结果展示方案概览

结果展示方案概览

搜索引擎建议爬虫工具

爬虫工具名称	描述
SE::Google::Suggest	Google 建议爬虫工具：查询结果数、查询建议、查询类型
SE::Yandex::Suggest	Yandex 建议爬虫工具：查询结果数、查询建议
SE::Bing::Suggest	Bing 建议爬虫工具：查询结果数、查询建议
SE::Aol::Suggest	Aol 建议爬虫工具：查询结果数、查询建议
SE::Yahoo::Suggest	Yahoo 建议爬虫工具：查询结果数、查询建议
SE::Youtube::Suggest	Youtube 建议爬虫工具：查询建议

示例

🔗 搜索建议抓取预设：支持从结果中排除包含停用词的建议

搜索建议抓取预设：支持从结果中排除包含停用词的建议

关键词爬虫工具

爬虫工具名称	描述
SE::Google::Trends	Google 趋势关键词爬虫工具
SE::Yandex::WordCraft	使用 Yandex Webmaster WordCraft 抓取 Yandex 搜索中的用户查询和热门网站
SE::Yandex::Wordstat	从 wordstat.yandex.ru 服务抓取关键词和展示统计数据
SE::Yandex::Wordstat::ByDate	按月或周抓取 Yandex WordStat 展示统计数据，关键词统计
Rank::Bukvarix::Domain	从 Bukvarix 按域名采集关键词：关键词、频率、排名
Rank::Bukvarix::Keyword	从 Bukvarix 按关键词采集相关词：关键词、频率、排名
Rank::Ahrefs::KeywordDifficulty	关键词难度、关键词、关键词数量
Rank::Ahrefs::KeywordGenerator	Ahrefs 关键词采集：关键词创意、带关键词的问题
SE::Google::KeywordPlanner	采集建议、关键词、竞争程度、最低和最高出价
SE::Yandex::Direct	特定查询的广告数量、标题、文本和域名、链接、锚文本、标签

示例

🔗 关键词季节性趋势

关键词季节性趋势

🔗 通过 WordStat 评估搜索频率

通过 WordStat 评估搜索频率

🔗 Wordstat 深度数据抓取

Wordstat 深度数据抓取

🔗 获取 Google Trends 类别列表

获取 Google Trends 类别列表

🔗 Google Trends 日期格式化

Google Trends 日期格式化

账号注册

爬虫工具名称	描述
SE::Yandex::Register	在 Yandex 中注册账号

示例

🔗 获取 Yandex 完整地区列表

获取 Yandex 完整地区列表

🔗 自动化注册 Yandex 账号

自动化注册 Yandex 账号

网站和域名参数爬虫工具

爬虫工具名称	描述
SE::Google::TrustCheck	检查网站信任度
SE::Google::Compromised	检查是否存在 "This site may be hacked" 标记
SE::Google::SafeBrowsing	检查域名是否在 Google 黑名单中
SE::Yandex::SafeBrowsing	检查域名是否在 Yandex 黑名单中
SE::Yandex::SQI	检查 Yandex 网站质量指数 (SQI)
Net::Whois	确定域名是否已注册、域名创建日期以及注册到期日期
Net::Dns	将域名解析为 IP 地址的爬虫工具
Rank::Cms	识别所有热门论坛、博客、CMS、留言板、维基及许多其他类型的引擎
Rank::Archive	抓取网站在 Web Archive 中首次和最后一次缓存的日期
Rank::MajesticSEO	从 majesticseo.com 服务抓取反向链接数量
Rank::Mustat	评估网站流量，以及域名价值和评级
Rank::Social::Signal	社交信号爬虫工具
Rank::Curlie	检查网站是否在 Curlie 目录中（DMOZ 的替代品）
Rank::Ahrefs	ahrefs.com 爬虫工具
Rank::KeysSo	keys.so 爬虫工具
Rank::MOZ	MOZ 爬虫工具
SecurityTrails::Ip	按 IP 采集域名
SecurityTrails::Domain	SecurityTrails 爬虫工具

示例

🔗 根据 Google 关键词抓取主题域名并获取各项域名参数

根据 Google 关键词抓取主题域名并获取各项域名参数

🔗 网站信息

网站信息

🔗 Net::Whois 提取自定义数据

Net::Whois 提取自定义数据

🔗 通过 Telegram 接收域名到期提醒

通过 Telegram 接收域名到期提醒

🔗 采集电子邮件地址库

采集电子邮件地址库

🔗 识别 IP 上的域名列表

识别 IP 上的域名列表

🔗 15 小时内识别 1,000,000 个域名的 CMS

15 小时内识别 1,000,000 个域名的 CMS

🔗 按特定 CMS 抓取网站域名

按特定 CMS 抓取网站域名

🔗 带订阅功能的 WordPress 网站

带订阅功能的 WordPress 网站

各种服务爬虫工具

爬虫工具名称	描述
SE::Yandex::Register	支持在 Yandex 中注册账号
SE::Bing::Translator	通过 www.bing.com/translator/ 服务进行翻译
SE::Google::Translate	Google 翻译
SE::Yandex::Translate	Yandex 翻译
SE::Bing::Images	Bing 搜索引擎图片爬虫工具
SE::Google::Images	Google 关键词图片爬虫工具
SE::Google::ByImage	以图搜图
SE::Yandex::Images	Yandex 关键词图片爬虫工具
SE::Yandex::ByImage	从 Yandex 通过链接抓取图片
SE::DuckDuckGo::Images	从 DuckDuckGo 抓取图片
SE::Dogpile::Images	从 Dogpile 抓取图片
Util::AntiGate	通过 AntiGate 服务识别验证码
Util::YandexRecognize	识别 Yandex 验证码
Util::ReCaptcha2	识别来自 Anti-captcha.com、Rucaptcha.com、Capmonster、Capmonster.cloud、Xevil、2captcha、R.I.P.captcha 资源的 ReCaptcha
SEO::Ping	向支持 Weblog API 的服务（Google Blog Search、Feed Burner、Ping-o-Matic 等）批量发送 Ping 请求
Check::RosKomNadzor	在俄罗斯联邦电信、信息技术和大众传媒监督局 (Roskomnadzor) 数据库中检查网站
SE::Yandex::Speller	通过 Yandex.Speller 检查页面文本错误
GooglePlay::Apps	Google Play 应用爬虫工具
Social::Instagram::Post	Instagram 帖子数据爬虫工具
Social::Instagram::Profile	Instagram 个人资料数据爬虫工具
Social::Instagram::Tag	Instagram 按标签抓取帖子
Social::Instagram::Geo	Instagram 指定位置帖子爬虫工具
Telegram::GroupScraper	Telegram 公开群组数据爬虫工具
API::Server::Redis	通过 Redis 与 A-Parser 交互
SE::Google::Cache	检查 Google 缓存中是否存在页面
Social::Instagram::Geo	Instagram 指定位置帖子爬虫工具
DeepL::Translator	通过 www.deepl.com 服务翻译文本
CoinMarketCap::LastPrice	CoinMarketCap 商店爬虫工具：代币名称、当前美元价格

示例

🔗 自动化注册 Yandex 账号

自动化注册 Yandex 账号

🔗 翻译引擎速度对比

翻译引擎速度对比

🔗 将整个文件作为查询请求使用

将整个文件作为查询请求使用

🔗 从目录加载文件进行 DeepL 翻译

从目录加载文件进行 DeepL 翻译

🔗 下载指定分辨率和大小的图片

下载指定分辨率和大小的图片

🔗 创建 JS 爬虫工具：处理验证码 (CAPTCHA)

创建 JS 爬虫工具：处理验证码 (CAPTCHA)

🔗 创建 JS 爬虫工具：处理 ReCaptcha2

创建 JS 爬虫工具：处理 ReCaptcha2

🔗 SEO::Ping 使用示例

SEO::Ping 使用示例

🔗 Social::Instagram::Geo 的位置链接爬虫工具

Social::Instagram::Geo 的位置链接爬虫工具

🔗 抓取 Instagram 用户信息

抓取 Instagram 用户信息

🔗 抓取 Telegram 公开群组用户

抓取 Telegram 公开群组用户

商店爬虫工具

爬虫工具名称	描述
Shop::Amazon	amazon.com 搜索结果爬虫工具
Shop::Yandex::Market	Yandex.Market 爬虫工具
Shop::AliExpress	Shop::AliExpress 搜索结果爬虫工具
Shop::eBay	Ebay 搜索结果爬虫工具
Shop::Wildberries::ProductsList	Wildberries 商品列表爬虫工具
Shop::Wildberries::ProductInfo	Wildberries 商品详情页爬虫工具
Shop::Wildberries::Suggest	Wildberries 搜索建议爬虫工具
Shop::Yandex::Market	Yandex.Market 商品爬虫工具

示例

🔗 从网站抓取商品信息

从网站抓取商品信息

地图爬虫工具

爬虫工具名称	描述
Maps::Google	Google 地图爬虫工具：机构名称、地址和坐标、评分、评论数量和价格政策、网站、电话、照片
Maps::Yandex	Yandex 地图爬虫工具：机构名称、地址和坐标、评分、评论数量和价格政策、网站、电话、照片、社交网络

示例

🔗 抓取 Google Maps 以采集特定地区的所有机构信息

抓取 Google Maps 以采集特定地区的所有机构信息

内容爬虫工具

爬虫工具名称	描述
Check::BackLink	在链接库中检查您的链接是否存在
HTML::LinkExtractor	抓取指定网站的外部和内部链接，可按选定层级抓取内部链接
HTML::ArticleExtractor	文章爬虫工具
HTML::TextExtractor	文本块爬虫工具
HTML::TextExtractor::LangDetect	识别页面语言，无需使用第三方服务
HTML::EmailExtractor	从网站页面抓取电子邮件地址
Net::HTTP	下载指定页面，支持多页抓取

示例

🔗 检查 Yandex 缓存中是否存在页面链接

检查 Yandex 缓存中是否存在页面链接

🔗 基于 HTML::LinkExtractor 爬虫工具的网站深度抓取

基于 HTML::LinkExtractor 爬虫工具的网站深度抓取

🔗 视频：使用 Net::HTTP 抓取 Booking.com 资源

视频：使用 Net::HTTP 抓取 Booking.com 资源

🔗 定期检查反向链接并将结果追加到表格

定期检查反向链接并将结果追加到表格

🔗 基于 HTML::LinkExtractor 爬虫工具的网站深度抓取

基于 HTML::LinkExtractor 爬虫工具的网站深度抓取

🔗 采集内链主题

采集内链主题

🔗 查找网站子域名

查找网站子域名

🔗 抓取网站并保存图片链接

抓取网站并保存图片链接

🔗 利用 JavaScript 功能生成 sitemap.xml

利用 JavaScript 功能生成 sitemap.xml

🔗 获取网站页面并检查 Google 和 Yandex 的收录情况

获取网站页面并检查 Google 和 Yandex 的收录情况

🔗 分析网站页面响应速度

分析网站页面响应速度

🔗 从联系页面抓取电子邮件

从联系页面抓取电子邮件

🔗 检查页面文本长度

检查页面文本长度

🔗 音译转换

音译转换

搜索引擎爬虫工具​

示例​

🔗 Google 和 Yandex 页面收录查询

🔗 视频：根据 Google 关键词抓取主题域名

🔗 Google 搜索结果中的问答数据抓取

🔗 根据 Google 关键词抓取主题域名并获取各项域名参数

🔗 抓取 Google 新闻日期并进行格式转换

🔗 仅从 Google 抓取搜索摘要 (Snippets)

🔗 Google 拼写检查

🔗 将 Google 链接和锚文本抓取到 CSV

🔗 使用任务链从 Google 搜索引擎抓取文本

🔗 Yandex 缓存爬虫工具

🔗 仅从 Yandex 抓取搜索摘要 (Snippets)

🔗 获取 Yandex 搜索结果及排名位置

🔗 Yandex 中的网站页面数量

🔗 从 Yandex 抓取关键词竞争程度

🔗 在俄语 (RU) 互联网细分市场寻找空白利基

搜索引擎排名爬虫工具​

示例​

🔗 同时获取多个地区的网站排名

🔗 同时获取多个地区的网站排名

🔗 结果展示方案概览

搜索引擎建议爬虫工具​

示例​

🔗 搜索建议抓取预设：支持从结果中排除包含停用词的建议

关键词爬虫工具​

示例​

🔗 关键词季节性趋势

🔗 通过 WordStat 评估搜索频率

🔗 Wordstat 深度数据抓取

🔗 获取 Google Trends 类别列表

🔗 Google Trends 日期格式化

账号注册​

示例​

🔗 获取 Yandex 完整地区列表

🔗 自动化注册 Yandex 账号

网站和域名参数爬虫工具​

示例​

🔗 根据 Google 关键词抓取主题域名并获取各项域名参数

🔗 网站信息

🔗 Net::Whois 提取自定义数据

🔗 通过 Telegram 接收域名到期提醒

🔗 采集电子邮件地址库

🔗 识别 IP 上的域名列表

🔗 15 小时内识别 1,000,000 个域名的 CMS

🔗 按特定 CMS 抓取网站域名

🔗 带订阅功能的 WordPress 网站

各种服务爬虫工具​

示例​

🔗 自动化注册 Yandex 账号

🔗 翻译引擎速度对比

🔗 将整个文件作为查询请求使用

🔗 从目录加载文件进行 DeepL 翻译

🔗 下载指定分辨率和大小的图片

🔗 创建 JS 爬虫工具：处理验证码 (CAPTCHA)

🔗 创建 JS 爬虫工具：处理 ReCaptcha2

🔗 SEO::Ping 使用示例

🔗 Social::Instagram::Geo 的位置链接爬虫工具

🔗 抓取 Instagram 用户信息

🔗 抓取 Telegram 公开群组用户

商店爬虫工具​

示例​

🔗 从网站抓取商品信息

地图爬虫工具​

示例​

🔗 抓取 Google Maps 以采集特定地区的所有机构信息

内容爬虫工具​

示例​

🔗 检查 Yandex 缓存中是否存在页面链接

🔗 基于 HTML::LinkExtractor 爬虫工具的网站深度抓取

🔗 视频：使用 Net::HTTP 抓取 Booking.com 资源

🔗 定期检查反向链接并将结果追加到表格

🔗 基于 HTML::LinkExtractor 爬虫工具的网站深度抓取

🔗 采集内链主题

🔗 查找网站子域名

🔗 抓取网站并保存图片链接

🔗 利用 JavaScript 功能生成 sitemap.xml

🔗 获取网站页面并检查 Google 和 Yandex 的收录情况

🔗 分析网站页面响应速度

🔗 从联系页面抓取电子邮件

搜索引擎爬虫工具

示例

搜索引擎排名爬虫工具

示例

搜索引擎建议爬虫工具

示例

关键词爬虫工具

示例

账号注册

示例

网站和域名参数爬虫工具

示例

各种服务爬虫工具

示例

商店爬虫工具

示例

地图爬虫工具

示例

内容爬虫工具

示例