跳转到主要内容

查询构造器

Query Builders (查询构造器) - 允许将原始查询拆分为多个部分和/或根据特定规则转换查询

功能

  • 使用正则表达式或自定义分隔符将查询拆分为多个部分
  • 替换查询中的子字符串或使用正则表达式进行替换
  • 从链接中提取域名\主域名
  • 在查询中的每个单词前添加 ! 符号(爬虫工具 SE::Yandex::WordStatSE::Yandex::WordStat 所需)
  • 将查询转换为大写\小写
查询构造器

获取的新变量可以在查询格式中用于构建发送给爬虫工具的查询,以及在结果格式中用于构建输出结果

主要应用场景

  • 从链接中提取域名,以便后续在 Rank::AhrefsRank::Ahrefs 及类似爬虫工具中检查域名
  • SE::Yandex::WordStatSE::Yandex::WordStat 自动在查询中的每个单词前补全 ! 符号

在查询中仅使用原始字符串的一部分

例如,我们有一个查询文件:

keyword1;100000
keyword2;200000

我们可以拆分关键词和已有的频率数据,检查关键词的竞争度,并将结果以 keyword;频率;竞争度 的格式保存到文件中

绕过代理检查器使用代理

如果创建变量 $proxy,则当前查询将直接使用该代理,绕过代理检查器。代理应以 http://ip:portsocks://ip:port 格式传递

使用示例

检查域名的 Ahrefs 评分并保存查询中的附加信息
假设我们有一个查询文件,格式为页面链接后跟空格及描述:

http://gofuckbiz.com/showthread.php?t=30454&page=11 GoFuckBiz.com 论坛   
https://searchengines.guru/ru/forum/720568 SearchEngines.guru 论坛

我们需要使用爬虫工具 Rank::AhrefsRank::Ahrefs 检查域名的 Ahrefs 评分,并将原始链接、域名、Ahrefs 评分和原始描述保存到结果中。那么任务设置如下:

查询构造器使用示例

结果我们将得到:

http://gofuckbiz.com/showthread.php?t=30454&page=11  Ahrefs rating of gofuckbiz.com: 51, Description: GoFuckBiz.com 论坛
https://searchengines.guru/ru/forum/720568 Ahrefs rating of searchengines.guru: 77, Description: SearchEngines.guru 论坛

下载示例

如何将示例导入 A-Parser

eJyFVOtO2zAUfpXIQhNMVdpC2aZICJVLp02FMii/KENecpJ6dWzjS4FVffcdO2lS
2KZJlRufy3du3/GKWGoW5kqDAWtIcrciKnyThGSQU8ct6RBFtQHt1XfkmopFkgzn
GnKDqsZoReyLAnSTS9CaZYBKluH90YF+yaUuqYdaUu681U4Qx5ksKRNk/W/3W8v4
w9RpYfADHursWqChsCylyqZzStb39x2CBpiQGVURMZLqx1UwzsQiiqrUI00tE0Uk
86g1qLJJgqTSd6IzMKlmyjJZK2pTFM9mgjTxbugSphLj5ZhmKx7h7ZKWoeSMWvDa
uOrG7l5sn30pNMuYx6e8Sto3ui3kVrDHUKmQaOujMzAjLUsUWQgAIaVNwXd1bwlC
uOD7rfIhSU65gQ4xmOqIYiLZWw2zgHVLPQn1onxFpBhyPoYl8NYs4J84xjNkxTBH
py+1499NJn9grJvytkPh6J805tCghNvJ5KL1yuRYFptmcFYyi3dzKp3ws+6hcAGg
mp5derNSamjC1Mh1dCS+AuF51o5sqFrRqzLCehjpdAobXqNJzVsNBTwHEP+fkO+7
8fvjvQjPvZ2NeBpMheMc3aQfladk2CKTknu/BQ18ranRcc6apvasWpfKm2yWp+XK
VqYoTKXIWTGpF2rDKiemuPITcSpLxcE2CTkD1y1nh6bmhr+0XXvrfBpCvHosrJTc
fL2p+qc0w0wPfYIljnc7ag2ZUs5vr8fbGu9orFQTca71G04FtpK5tSrpdguZu3Tx
g/2KU1l2zVw+WVxumsVqro7t0UFvcDh4p2gBR/1+NHO9wf7Anwfgz0EvnAdBkkaf
5QixTiqsmfARDIYwQHU6B1EwASYunHZd/OECu7L7cb93+OHT/4BvAsL5FgLxVVso
JPIHZ+LnV7+wzTu8ev3OJqs1cv+nuarM/EyCEJ9BvCKxSdJf/waafQGO