SE::Yandex - Yandex 搜索结果爬虫工具

爬虫工具概览
Yandex 搜索结果爬虫工具名列最受欢迎的五大爬虫工具之列。我们爬虫工具的核心竞争优势之一是其惊人的性能。得益于 A-Parser 的多线程工作机制,查询处理速度可达 每分钟 3000-7000 次查询,平均每分钟可获取多达 5,000,000 条链接,且资源消耗极低,任何办公或家用电脑以及入门级 VDS 均可胜任。我们的爬虫工具支持 Yandex 的所有搜索算子,极大地扩展了数据抓取的能力。 通过 AntiCaptcha 或任何其他支持其 API 的服务(Anti-Captcha, RuCaptcha, CapMonster.cloud, 2captcha 等)进行验证码识别,确保了抓取过程的稳定性和连续性。
灵活的设置允许指定结果类型(移动端/桌面端)、地区、语言、按日期排序等。 A-Parser 的功能允许保存抓取设置以供后续使用(预设),设置抓取计划等。您可以使用查询的自动扩展、从文件替换子查询、遍历数字字母组合和列表,以获取尽可能多的结果。
得益于内置强大的模板引擎 Template Toolkit,结果可以按您需要的任何形式和结构保存,该引擎允许对结果应用额外逻辑,并以包括 JSON, SQL 和 CSV 在内的各种格式输出数据。
爬虫工具应用案例
🔗 Yandex 搜索结果与排名
获取 Yandex 搜索结果及结果的排名。结果将保存到 csv 文件中。
🔗 数据抓取 Yandex Lite 版搜索结果
本文介绍了创建一个爬虫工具的示例,用于从 Yandex 搜索引擎的 Lite 版本中采集信息。
🔗 数据抓取 Yandex 广告
该预设解析 Yandex 搜索结果中的广告块,并将结果保存为 json 格式。
🔗 Yandex 竞争度评估
该预设根据关键词确定 Yandex 搜索引擎中的竞争程度。
🔗 Yandex 缓存爬虫工具
该预设实现了获取 Yandex 搜索引擎缓存链接的功能。
🔗 仅从 Yandex 数据抓取摘要 (Snippets)
该预设接收单词或短语作为参数,用于在 Yandex 中进行搜索。
采集的数据

- 查询结果总数
- 搜索结果中的链接、锚点和摘要
- 同时采集每个结果的标记信息,目前支持的标记有:日期、图片预览、视频、富摘要 (Rich snippet)、精选摘要 (Featured snippet)
- 首次和最后一次缓存时间(仅限桌面端结果)
- 相关关键词列表 (Related keywords)
- 判断 Yandex 是否将查询视为拼写错误
- 抓取页面缓存链接(仅限桌面端结果)
- 网站图标名称及其类型列表(包括 Turbo)
- 所有页面的顶部、中部和底部广告块
- 链接、可见链接、锚点、摘要和域名
- 附加链接和锚点
- 地铁站信息
- 缺失词汇(搜索结果下方可能显示的带有“未找到”标记的词汇)
- 快速回答列表 (Quick answers):问题、答案、来源链接(通过单独的 Parse Quick answers 选项开启)
- AI 回答(Alice 搜索)、其类型及来源列表
功能特性
- 选择结果类型:移动端/桌面端
- 支持 Yandex 的所有搜索算子 (site:, lang: 等)
- 抓取 Yandex 提供的最大结果数 - 25 页,每页 50 个元素
- 支持搜索相关关键词
- 支持选择搜索地区、域名
- 支持按日期排序结果
- 抓取页面索引时间,并可根据此参数过滤结果
- 浏览器模拟选项(可实现高抓取速度和低验证码消耗)
- 支持通过 AntiCaptcha 或任何其他支持其 API 的服务绕过验证码(建议在 AntiGate 设置中开启 is_russian 参数)
- 可设置爬虫工具通过深度点击每个问题应采集的快速回答 (Quick answers) 数量
基于 Yandex 爬虫工具运行的还有以下爬虫工具:
SE::Yandex::Position - 在 Yandex 中按关键词检查网站排名
使用场景
- 采集链接库 - 用于 A-Poster, XRumer, AllSubmitter 等
- 关键词竞争程度评估
- 查找网站反向链接(提及)
- 检查网站索引情况
- 寻找存在漏洞的网站
- 任何其他涉及以某种形式抓取 Yandex 的场景
查询
查询时需输入搜索短语,就像直接在 Yandex 搜索框中输入一样,例如:
窗户 北京
lang:en windows Moscow
url:a-parser.com
site:a-parser.com
"a-parser.com"
查询扩展
您可以使用 内置宏 来扩展查询,例如我们想获取一个非常大的论坛数据库,指定几个不同语言的基础查询:
forum
论坛
foro
论坛
在查询格式中指定从 a 到 zzzz 的字符遍历,此方法可以最大程度地轮换搜索结果并获取大量新的唯一结果:
$query {az:a:zzzz}
该宏将为每个原始搜索查询创建 475254 个额外查询,总计 4 x 475254 = 1901016 个搜索查询,数字虽然惊人,但对于 A-Parser 来说完全不是问题。在每分钟 2000 次查询的速度下,该任务仅需 16 小时即可处理完毕。
使用算子
您可以在查询格式中使用搜索算子,这样它会自动添加到列表中的每个查询:
site:$query
账号
为了运行爬虫工具
SE::Yandex,可能需要 Yandex 账号。可以使用爬虫工具
SE::Yandex::Register 注册账号,或者直接将现有账号以支持的格式添加到 files/SE-Yandex/accounts.txt 文件中。
或者可以开启“即时”账号注册。
使用会话授权工作时,数据行必须符合以下格式:
[email protected];MAQT78Z31Rinx4H;{"answer":"qmfhsxdcrk","proxy":"185.104.120.45:3128","session_id":"3:1748440908.5.0.1748440867459:ZXBxpg:47e4.1.2:1|2191075974.41.2.2:41.3:1748440908|3:10308131.797655.5pfkoRZWgLJGntKTlcUhYdysNfk"}
结果输出示例
A-Parser 得益于内置的模板引擎,支持灵活的结果格式化 Template Toolkit, 使其能够以任意形式以及结构化形式(如 CSV 或 JSON)输出结果
导出链接列表
结果格式:
$serp.format('$link\n')
结果示例:
https://TestoMetrika.com/tests/
https://onlinetestpad.com/ru/tests
https://www.speedtest.net/
https://ustaliy.ru/testi/
https://yandex.ru/internet/
https://konstruktortestov.ru/popular
https://TestEdu.ru/test/
https://kto-chto-gde.ru/category/tests/
https://weekend.rambler.ru/tests/
https://GadalkinDom.ru/test
...
链接 + 锚点 + 摘要(含位置输出)
结果格式:
[% FOREACH item IN serp; loop.count _ ' - ' _ item.link _ ' - ' _ item.anchor _ ' - ' _ item.snippet _ "\n"; END %]
结果示例:
1 - http://forum.r-rp.ru/ - <b>forum</b>.r-rp.ru -
2 - https://forum.arizona-rp.com/ - <div class=a11y-hidden>带附加链接的网页结果</div><b>论坛</b> – Arizona Role Play - 菜单。首页。 <b>论坛</b>. 新消息。有什么新鲜事?新消息。用户。当前访客。 <b>论坛</b>. 登录。 ... 统计 <b>论坛</b>. 主题。1,247,176。消息。5,225,340。用户。623,675。
3 - https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D1%83%D0%BC - <b>论坛</b> — 维基百科 - <b>论́坛</b> (拉。 <b>forum</b> — 古。墓地的前厅;压榨机中待处理葡萄的场地;市场广场,城市市场;集市,中心广场):
4 - https://zen.yandex.ru/media/propromotion/chto-takoe-forum-i-vse-chto-s-nim-sviazano-5d65164c1d656a00ad52ba30 - 什么是 <b>论坛</b> 及其相关的一切 | 创意... - 今天我们将用通俗易懂的语言讨论什么是 <b>论坛</b> 以及与之相关的一切。我们每个人都渴望找到志同道合的人,建立基于共同兴趣的交流,分享经验,提供建议。在现代世界,这一切足不出户即可实现。网页<b>论坛</b>.
5 - https://forum.vimeworld.ru/ - VimeWorld - <b>论坛</b> - <b>论坛</b> 理想的 Minecraft 游戏服务器项目 - VimeWorld...
...
将链接、锚点和摘要输出到 CSV 表格
内置工具 $tools.CSVLine 允许创建正确的表格文档,可直接导入 Excel 或 Google 表格。
通用结果格式:
[% FOREACH i IN p1.serp; tools.CSVline(i.link, i.anchor, i.snippet); END %]
文件名:
$datefile.format().csv
起始文本:
链接,锚点,摘要
在 通用结果格式 中,使用 Template Toolkit 模板引擎 通过 $serp 循环输出 FOREACH.
在结果文件名中,只需将文件扩展名更改为 csv。
要在 任务编辑器, 中显示“起始文本”选项,需要激活“更多选项”。 在“起始文本”中填入以逗号分隔的列名,并将第二行留空。
输出广告块
结果格式:
$ads.format('$link - $anchor - $snippet\n')
结果示例:
http://yabs.yandex.ru/count/WcOejI_zO3C2vH80P1zY-_ryBtnaD0K0CmCnZYWCO000000u109mhiMfd8qUW07CkUOvY07Kyz3GCP01vCcQhIwO0PgqhFigk06qZQ3m6C01NDW1gkAR5E01kAZK4-W1y06W0kYCvAl-Wue5-0Bmwl7WeSQurUK1c0FRc3lkh0Ju1Bpr48W5lFKGa0MxjssW1Qxa1QW5hkG5i0Mkv0Mu1OYr9S05eTt90SW5aFn4YkWqZwuhO8VP1W00012H0000gGVlTvJIyeiV0R07W82O3BW7W0Nn1tjIyvgFUtz-X8A0WSIqXdB92j4AXC7wM-4_u3nZJEzt003CKjw5aRa50DaBw0kyzRAxthu1gGn-j62AsN3cl-WCemBW3OE0W4293eDHIPs09kwAqTFvwFMAi8VO3WAX3zaFW13WszlG4DcTXo9ZI0HkD3-n4YxXl0bOc-q2u1E8jIMW58Yr9QWKkxTjl9wVx0Ne58m2q1Mydf_i1TWLmOhsxAEFlFnZyA0Mq92TW0R95l0_q1Qokzw-0O4N0F0_c1UwdvGKg1S9m1Uq0jWNm8GzcHYW60wm68UTi806q1WX-1Yf-9keZlxncYM06R3qkEBGlP6v890P0Q0PmWEm6RWP____0T8P4dbXOdDVSsLoTcLoBt8qEJSjCkWPWC83y1c0mWE16l__WxZFMxv27W2GPM2khLr2HGBSgKCU4fSjR_apLy29ToVZBSaX0K10aLK2xDc6HsxyWlx3mqOzRTCnV7G7IDvEXnY4YqauFXdHmHcIWrcJNGT1NfMC_8eB8q1m1-WEYbKFtWBTZHwcD4A80G00~1?from=yandex.ru%3Bsearch%26%23x2F%3B%3Bweb%3B%3B0%3B&q=%D0%BA%D1%83%D0%BF%D0%B8%D1%82%D1%8C+%D0%B0%D0%B2%D0%B8%D0%B0%D0%B1%D0%B8%D0%BB%D0%B5%D1%82%D1%8B&etext=2202.wBaB7RlytlP_PRaU6jPhHD2nHBNT_4gSF6009OyJEfpWjUPoA5WrSJAqCfap0m9ReXhoaGRlaWhmYmllemF2ZA.f04b1271668949ea17ffcafcb11c72c2ab6454c5 - <b>购买</b> <b>机票</b> 到 / aviasales.ru - 我们提供: <b>购买</b> <b>机票</b> 到这里。超级优惠!赶快行动!
http://yabs.yandex.ru/count/WgGejI_zO5e2rHG092HY-_ryhkYFF0K0MWCnZYWCO000000u109mhDZpa8WGW07ZZm680U2f-wrQa07AywxRoe20W0AO0ShphjjAk06oWAxe8C01NDW1e8MobW7W0TJCXm_e0O01c0BImFq2e0BuQjW20l02g_w3YWNu0l3gyU2XnhZLvG600vF6eiSFY0FStR-O39W3cyKxYga3-0JJpWI81TFE1905Z-zGe0MPj06e1PMM0R05bPO1k0NInnJ01TF1ZG781PNz8uheD8-kAs27sGO0000GaG000Aa7xtUKqlAB7m6m1u20c0ou1u05yGTxKlEQZtj_VeI2l3M02W712l_aZtPQIU8_oGeJ5NRdMhxJFweB4E0yOqplTm00p5BUXP6v1G3P2-WBqyu4y0i6Y0ookzw-0QaCu_jL-Yu3zB_e3AC2u0s3W810YGwgO5HI9w3dYj7J-UZrYh27s0u2-0x7dPAe2Q4FFGhNet0zzZ_P3_0_W13GmC4Rm92GPpgqxC9xJZC_iHAuM7p6uhZj0k0JqiSKe1JInnIe58_lKB0KYw381hWKmAo0jQI04TWK-FpP_WNe58m2q1Nu_Dd-1TWLmOhsxAEFlFnZyA0Mq92TW0R95j0MihlUlW615vWNfwZz3wWN2S0Nj0BO5y24FPaOe1WAi1Z9fB201j0O8VWOgVYRg8x-yPebW1cmzBZYqBsHkI2G6G6W6S83i1cu6V___m7I6H9vOM9pNtDbSdPbSYzoD3atBJBe6O320_0PWC83WHh__oD2TTsApne0jsLWrgrT_2INXiZt8r8kcvWxe0SCE37tPBmjEYG0203ecjreFlD0AY-khXXjgcFZa190IXd9BOrkl3guMzzraExES_xHXH4WwWDq1xIoUlHJ6Y74~1?from=yandex.ru%3Bsearch%26%23x2F%3B%3Bweb%3B%3B0%3B&q=%D0%BA%D1%83%D0%BF%D0%B8%D1%82%D1%8C+%D0%B0%D0%B2%D0%B8%D0%B0%D0%B1%D0%B8%D0%BB%D0%B5%D1%82%D1%8B&etext=2202.wBaB7RlytlP_PRaU6jPhHD2nHBNT_4gSF6009OyJEfpWjUPoA5WrSJAqCfap0m9ReXhoaGRlaWhmYmllemF2ZA.f04b1271668949ea17ffcafcb11c72c2ab6454c5 - <b>购买</b> <b>机票</b> 在线在 Tutu.ru!官方网站! - 廉价机票!全球优惠航班! <b>购买</b> 在线购票!
http://yabs.yandex.ru/count/WcOejI_zO3C2vH80P1zY-_ryBtnaD0K0CmCnZYWCO000000u109mhiMfd8qUW07CkUOvY07Kyz3GCP01vCcQhIwO0PgqhFigk06qZQ3m6C01NDW1gkAR5E01kAZK4-W1y06W0kYCvAl-Wue5-0Bmwl7WeSQurUK1c0FRc3lkh0Ju1Bpr48W5lFKGa0MxjssW1Qxa1QW5hkG5i0Mkv0Mu1OYr9S05eTt90SW5aFn4YkWqZwuhO8VP1W00012H0000gGVlTvJIyeiV0R07W82O3BW7W0Nn1tjIyvgFUtz-X8A0WSIqXdB92j4AXC7wM-4_u3nZJEzt003CKjw5aRa50DaBw0kyzRAxthu1gGn-j62AsN3cl-WCemBW3OE0W4293eDHIPs09kwAqTFvwFMAi8VO3WAX3zaFW13WszlG4DcTXo9ZI0HkD3-n4YxXl0bOc-q2u1E8jIMW58Yr9QWKkxTjl9wVx0Ne58m2q1Mydf_i1TWLmOhsxAEFlFnZyA0Mq92TW0R95l0_q1Qokzw-0O4N0F0_c1UwdvGKg1S9m1Uq0jWNm8GzcHYW60wm68UTi806q1WX-1Yf-9keZlxncYM06R3qkEBGlP6v890P0Q0PmWEm6RWP____0T8P4dbXOdDVSsLoTcLoBt8qEJSjCkWPWC83y1c0mWE16l__WxZFMxv27W2GPM2khLr2HGBSgKCU4fSjR_apLy29ToVZBSaX0K10aLK2xDc6HsxyWlx3mqOzRTCnV7G7IDvEXnY4YqauFXdHmHcIWrcJNGT1NfMC_8eB8q1m1-WEYbKFtWBTZHwcD4A80G00~1?from=yandex.ru%3Bsearch%26%23x2F%3B%3Bweb%3B%3B0%3B&q=%D0%BA%D1%83%D0%BF%D0%B8%D1%82%D1%8C+%D0%B0%D0%B2%D0%B8%D0%B0%D0%B1%D0%B8%D0%BB%D0%B5%D1%82%D1%8B&etext=2202.wBaB7RlytlP_PRaU6jPhHD2nHBNT_4gSF6009OyJEfpWjUPoA5WrSJAqCfap0m9ReXhoaGRlaWhmYmllemF2ZA.f04b1271668949ea17ffcafcb11c72c2ab6454c5 - <b>购买</b> <b>机票</b> 到 / aviasales.ru - 我们提供: <b>购买</b> <b>机票</b> 到这里。超级优惠!赶快行动!
...
保存相关关键词
结果格式:
$related.format('$key\n')
结果示例:
<b>test</b> tanki online
tanki online
所有 <b>测试</b> 点 ru
i exam ru 测试
<b>测试</b> 网速
<b>tests</b>24.ru
speedtest
在线 <b>测试</b> 电脑性能
在线测试
my <b>test</b> student 如何知道答案
...
要自动去除结果中的 HTML 标签,需使用 结果构造器, 选择数组 $related 并应用 Remove HTML tags.
关键词竞争程度
结果格式:
$query - $totalcount\n
结果示例:
所有测试点 ru - 25000000
在线测试 - 13000000
tanki online - 7000000
i exam ru 测试 - 27000000
tests24.ru - 238000000
在线电脑性能测试 - 16000000
speedtest - 2000000
网速测试 - 16000000
test tanki online - 19000000
my test student 如何知道答案 - 16000000
识别带错误的关键词
结果格式:
$query - $misspell\n
结果示例:
在线测试 - 0
网速测试 - 0
在线测试(带错别字) - 1
网速测试(带错别字) - 1
检查链接索引情况
查询格式:
site:$query
结果格式:
$query.orig - $totalcount\n
结果示例:
https://a-parser.com/pages/buy - 2
https://a-parser.com/wiki/parsers - 16
https://trjkjfkdf.bg.ky - 0
https://a-parser.com/resources - 1000
https://a-parser.com/forum - 499
要检查链接索引情况,请在查询格式中填入相应的算子: site:.
结果格式以“原始 URL - 索引页面数量”的形式输出。
结果中我们将获得页面地址及其在搜索引擎索引中的数量。
如果页面不存在,结果将为: 0.
以 SQL 格式保存
结果格式:
[% FOREACH serp; "INSERT INTO serp VALUES('" _ query _ "', '"; link _ "', '"; anchor _ "')\n"; END %]
结果示例:
INSERT INTO serp VALUES('测试', 'https://konstruktortestov.ru/popular', '热门在线 <b>测试</b>')
INSERT INTO serp VALUES('测试', 'https://TestoMetrika.com/tests/', '在线 <b>测试</b> c 含心理学精准结果...')
INSERT INTO serp VALUES('测试', 'https://ustaliy.ru/testi/', '<b>测试</b> 在线:最好、最有趣和最热门的')
INSERT INTO serp VALUES('测试', 'https://www.SunHome.ru/tests/Interesting_tests', '有趣的 <b>测试</b>. 完成心理学趣味...')
INSERT INTO serp VALUES('测试', 'https://onlinetestpad.com/ru/tests', '<b>测试</b> 在线 | Online Test Pad')
...
将结果转储为 JSON
通用结果格式:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.totalcount = p1.totalcount;
obj.links = [];
FOREACH item IN p1.serp;
obj.links.push(item.link);
END;
obj.json %]
起始文本:
[
结束文本:
]
结果示例:
[{"totalcount":113000000,"links":["https://TestoMetrika.com/tests/","https://konstruktortestov.ru/popular","https://ustaliy.ru/testi/","https://www.SunHome.ru/tests/Interesting_tests","https://GadalkinDom.ru/test","https://zen.yandex.ru/tes","https://onlinetestpad.com/ru/tests","https://kto-chto-gde.ru/category/tests/","https://psytests.org/top.html","https://MixTests.com/new/","https://TestEdu.ru/test/","https://testserver.pro/index","https://onedio.ru/tests","https://BankTestov.ru/","https://weekend.rambler.ru/tests/","https://edieta.org/testi","https://trikky.ru/?%21","https://BBF.ru/tests/","https://dropi.ru/c/tests/raznie","https://cadelta.ru/tests","https://www.Elle.ru/tests/","https://www.adme.ru/svoboda-psihologiya/polnyj-spisok-psihologicheskih-testov-dlya-poznaniya-sebya-kotorye-mozhno-projti-onlajn-2071715/","https://www.ellegirl.ru/tests/","https://test.tankionline.com/","https://vraki.net/onlajn-testy/","https://Lifehacker.ru/psixologicheskie-testy/","https://iq2u.ru/tests","https://www.b17.ru/tests/","https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82","https://gurutest.ru/test/","https://www.psychologies.ru/tests/","https://peopletalk.ru/category/tests/","https://obrazovaka.ru/testy","https://likeyou.io/category/test/","https://ProfTest.me/tests","https://TayniyMir.com/testy","https://psi-technology.net/psytest/","https://www.kp.ru/putevoditel/online-test/","https://tvoytest.ru/","https://twizz.ru/tests/","https://lunanews.net/testy/","https://www.ivi.ru/titr/tests","https://sntch.com/tests/","https://testy.online/","https://videouroki.net/tests/","https://www.speedtest.net/ru","https://rb.ru/tests/","https://aznaetelivy.ru/tests/","https://woman-psy.com/psihologicheskie-testy/testy_na_eruditsiyu_i_znaniya/interesnye_testy/","https://mamochka-club.com/psihologicheskie-testy/interesnye-testy/"]}]
要在 任务编辑器, 中显示“起始文本”和“结束文本”选项,需要激活“更多选项”。
结果处理
A-Parser 允许在抓取过程中直接处理结果,本节列出了 Yandex 爬虫工具最常用的案例
链接去重
添加去重并在下拉列表中选择 $serp.$i.link - Link.
下载示例
eJx9VE2P2jAQ/SurEYdWQqvQLpfcWFSqVnTZLuyhohy8ZIJcHNu1HQqK+O+dCUkc
ttVeoszze/NtVxCE3/tHhx6Dh3Rdga3/IYXlpzT9IXSGx5u51Ht/86zl7xJhCFY4
j47p6x6LDjLMRakCDCsIJ4vkxBzQOZmxSmZkW2eOJ4fBSfSEHYQqmTZKkgTOb8jE
Drem1CFqRm/QFedr0bEsKsZJT1K2xVC5nHK6BqrJEsBi2AwbxupC95Sx3kGLflbm
RShIgyvxvNm0XvzMuEJw8wZ2dNt0sjtcigOuDB3mUsXIfkbWgyg4yiATAfn0Nq8d
vXt/G47sQWSZDNJooS4RuPcxajOYFLQhLv1yd2fOFAQFrB0weGqzW8OgtmOV3y8a
SHOhPA7BU6ozQYlkr09kQCeCcQvL+RBegdETpeZ4QBVptf/7UqqMFmWSk+hLI/w/
ZfGPj3NXXj8UDfqPoxw6L7V1v/gWVZmZmx1Vnr3UwyxkINtP6+1JISFwj2i7nj1w
zwrjsAvTeG6i092wqHmr4sgmNkJXZVyN5RrcGp3L3aLZ1JZZ6hVdwIWemsIq5Lp0
qRSNxeNTXI+Jb8bARkzwtXhah+DS23sIwRjlvy4vqVonaf3GnGBBnexHbVxuhVLP
T/P+CcSVIuNnmdzdfeDvx3H9P7ogwNqAO0NbRZWdN90r0b0tVf+tSKszjeqXf7yQ
uC6mEEYN8jQHvuB/AYBymo0=
另请参阅: 结果去重
按域名进行链接去重
添加去重并在下拉列表中选择 $serp.$i.link - Link. 选择去重类型: 域名.
下载示例
eJx9VE2P2jAQ/SvI4tBKCIV2ueTG0lK1ost2YQ8V5WDIBLk4tms7FBTx33fGCXHY
VnuxPG/mzbddMc/dwT1acOAdS9cVM+HOUrb8nKY/ucrg1JsLdXC9ZyX+lNDbnnuf
dMGFYgNmuHVgibju2KMig5yX0rNBxfzZALrTR7BWZIBKkaFsrD6dLXgrwCF25LIk
s1GSJOzyBo3vYadL5SNn9Ia5pMwNWKJFxjjpUMpQFiqxcEo5XTOsySBAZLYZNBar
2jy71l6jX6TecslSb0u4bDZXL26mbcGpjX0zGjY9bZVLfoSVRmUuZIzsZig98IKi
9DPugbTDPDh6937oT+SBZ5nwQisu6wjU+xi1HhHylUZbvFJ3Z1YXCHkIDgg8X7Nb
s36QY5U/ag5Lcy4dDJjDVGccE8lea4QHy722C0P5IF4xrSZSzuEIMpoF//elkBku
yiRH0teG+H+TxT8+Lm153VA46L8Wc2i9BOl+8T2yMj3XexrZNgyzEB5lNw3bk7IE
wQOAaXv2QD0rtIU2TOO5iY6vxICirYojm5gI3ZRxM5ZbcKdVLvaLZlOvlqVa4VNc
qKkujASqS5VS4lgcPMX1mLhmDCTEBF+TpyEElX59h8xrLd23ZZ2qsQLXb0wJFtjJ
btTG5Y5L+fw072pYXCkUfpXJ3d0HOj+Ow31UI4y4HvYatworu2zaX6L9ZaruX5FW
FxzVb/dYG1FdZIIYNsjhHOiBvwAa7J3h
另请参阅: 结果去重
提取域名
添加 结果构造器 并在下拉列表中选择源: $p1.serp.$i.link - Link. 选择类型: Extract Domain.
下载示例
eJx9VEtv2zAM/isFkcMGBIGzNRff0qwBNmRN17SHIetBi+lAiyxpkpwlMPzfR8qO
7XZDL4b5+Eh+fKiCIPzB3zv0GDyk2wps/IcUNrdp+l3oDE9Xt6fgxC5cfTKFkNrD
GKxwHh0jtgNHMmSYi1IFGFcQzhYpjjmiczJDMsqMZOvM6ewwOIkc6ShUyW7TJEmg
fgMm9rgzpQ49ZvqGu5L64C06hvWIWVI/P4+BKFKNfmlcIZjqyE4nLe/OuBFHfDRk
zKXCXr0k6U4UnHKUiYBsneQx0Lv3k3DiCCLLZJBGC9Vk4Db1WZ+0/B0Za0O+9MuN
WDpTkCpgDMDK86W6LYyiDBSijNhvDQbSXCiPY/BU6lJQIdlriwzoRDBubbke0ldg
9FypFR5R9W4x/k0pVUYznecE+twC/++y/idG3dEbpqKZ/HFUQxclSjfrrz0qMyuz
J+bZT+KtZCEDyX4RB51CQsoDou16dsc9K4zDLk0buc1Om2xR8wL0I5vbXvWCxoux
DJQVeFO6HeXbJuMt0KLbWJw+AG9Pu3HYHEVzEzx158SZ9K17MO0WQk2YndG53K/b
Jb1kLvUjnd9aL0xhFXKfdKkUjdnjQ79uc9+OlYWe8GvwIqbgVl5OkGowyn/ZNNSt
k1TSjAkXNJlh1jbkTij19LAaWqBfURJ+lMn19Qf+fpzF/2mjAcYG3BvaUmLGhNsH
ontZquEzkVY1jf6Xv2+cmBe7kI4a5GmufNt/AaiMmIc=
另请参阅: 结果构造器
去除锚点和摘要中的标签
添加 结果构造器 并在下拉列表中选择源: $p1.serp.$i.anchor - Anchor. 选择类型: Remove HTML tags.
再次添加 结果构造器 并在下拉列表中选择源: $p1.serp.$i.snippet - Snippet. 选择类型: Remove HTML tags.
下载示例
eJyVVN9v2jAQ/lcii4dNQihs5SVvFA11Ey0dtA8T64NHLszDsT3bYaCI/313jknS
rqq0lyi+u++7X59dM8/d3t1bcOAdyzY1M+GfZWz9Kcu+cZXDMVlBqQ+Q3DzcLhLP
dy4prC6Tqdr+1NYlGJOslTCGKIbMcOvAEtmmx4GOHApeSc+GNfMnA5gCSa0VOaBT
5Hg2Vh9PFrwVQEwHLisKG6dpys5vwPgOtrpSvsOM3wiXQu2dAUuwDjFJz09PQ4bd
Y41urm3JaQoDMx7FkbTONT/Ag0ZnISR05jme7nhJKQc590DeURGI3r0f+SMx8DwX
XmjFZZOBxtRlfVTid+hYaYzFXxrEHGeNJg+BgIynS3UbNghnhhRVwH5tMCwruHQw
ZA5LnXMsJH/pER4s99ouDdWD9pppNZVyAQeQXVjgv66EzHGn0wJBnyPw9ZDlPxzn
tr1+KtzJH4s1tCzhdL287VC5Xugddp7/wL6lKIXHs5uFRWcsReMewLQzu6OZldpC
myYyx+wocgOKBNCtbGo607M2nq2lZ6yZ05XdYr5NOtwwFLqhrYabwEg/UXM23Jgb
X0pyW8tPaIzRnqQTISTT1xhdc5/+i/KCOSNmq1Uhdsuo/Es7lXrA675UM10aCTR8
VUmJ2nGw6jQ8dVErdOim+BI8CyloP5d7jWVo6b6sm3kaK7CqyTAW3s8aKbdcysfV
ou9hne7x8L1Kr64+0PfjJPyPGwsjrIedRuljZ9RwfHXal6zuvz1ZfUY9/XL3TRD1
RSFowwE5FAs9GH8BhLW+Jg==
结果构造器可以根据需要添加多次。
另请参阅: 结果构造器
按包含关系过滤链接
添加过滤器并在下拉列表中选择: $serp.$i.link - Link. 选择类型: 包含字符串. 接着在 字符串 中填写过滤特征,例如,如果我们希望结果中仅保留包含 .com, 的链接,就在“字符串”中填写它。
下载示例
eJx9VE2P2jAQ/SvI4tBKCMFhL7mxqEit6LJd2EOFOHjxJHJxbNd2KCjKf++ME+Kw
rfaW+Xhv3nw4NQvcn/yzAw/Bs2xfMxu/Wca2X7LsJ9cCLqOVVAGc1MXo7TryIX5J
PVJSn9iEWe48OELvByAMCMh5pQKb1CxcLSCnOYNzUgAGpUDbOnO5OkBG8Og7c1VR
2nw2m7HmAxgv4GgqHRJm/kE66fQWHMES4mE2gOSxQwxi9yQ52zPsyaIjNnmYdBm7
Nv1odOBSDyRPj6ZE09ggjUbbg/asORxujH5lXMlprmM7n3ZD7oNbfoadaXVAcuPc
4YmXxD8WPABFp3kk+vR5Gi7EwIWQVJOrtgLtIVV91fJ31KcN5uInTXrlUGvGAkQC
cl5v6vZsHG3quIrYHy2GZTlXHibMo9QVRyHifUTifHgwbhNngP6aGb1Qag1nUCkt
8j9WUgk8mkWOoK8d8P8pm384mr69YSlc+h+HGnqWaD1uvieUMGtTYOfiLS62lAFt
v4yXlLEZOk8Atp/ZE82sNA76Mh1zVx2fjQVNF5ZWtrDJddfG3VrunXhNuSw23dXe
Miu9w7e50UtTWgXUl66UwrV4eEnnsfDdGshIAt+Dl7EEtX57kywYo/y3bSvVOonn
90ACS5zksGpHeeRKvb6shxGWTiqekyfaI95pYfCCsIvm0P8d+l9MPfxHZHWDa/nl
n9sk6oFS0IfD8PElzZu/Z6ed/A==
另请参阅:结果过滤器
可用设置
| 参数名称 | 默认值 | 描述 |
|---|---|---|
| AntiGate preset | default | 选择预设 Util::AntiGate,设置详情见 此处 |
| AntiGate preset for old captcha | default | 类似于 AntiGate preset,但仅用于普通(旧式,单张图片形式)验证码。如果此处未选择预设,则此类验证码将使用在 AntiGate preset 中选择的预设。 |
| Experimental img captcha max count | 5 | 每次尝试的最大重复验证码图片数量 |
| Preffered captcha type | Click | 选择首选验证码类型:Click 或 Puzzle |
| Engine | HTTP (Fast, JavaScript Disabled) | 允许选择引擎:HTTP(速度快,但验证码概率高)或浏览器(速度慢,但验证码概率低) |
| Device | Modern desktop computer (Windows 10, Chrome 84) | 选择结果类型 (Desktop computer / Mobile device) |
| Pages count | 5 | 抓取页数(1 到 25) |
| Sort serp by date | ☐ | 按日期排序结果 |
| Serp time | All time | 搜索时间范围 |
| Yandex domain | www.yandex.ru | 用于抓取的 Yandex 域名,支持所有域名(.ru, .ua, .by, .kz, .com.tr, .com)。从 1.1.345 版本开始,根据所选地区自动选择。 |
| Region of serp (lr=) | 北京 | 选择搜索地区(参数 lr=) |
| Custom region ID | 允许指定选择列表中不存在的地区 ID。此选项优先级高于 Region of serp (lr=)。必须在 Yandex domain 中设置相应的域名。 | |
| Search sites from (rstr=) | Not set | 选择网站的地区关联性(参数 rstr=) |
| Language | Any | 搜索结果语言 (Russian, English, Belorussian, French, German, Indonesian, Kazakh, Tatar, Turkish, Ukrainian) |
| Parse not found | ☑ | 确定在搜索查询结果为零并提供其他查询结果时是否进行抓取 |
| Not personalized | ☐ | 搜索个性化。详情点击此处 |
| Filter pages | Moderate filter | 过滤不良内容 (Family search / Moderate filter / Do not filter) |
| Use Accounts | ☐ | 使用 files/SE-Yandex/accounts.txt 文件中的现有账号。 SE::Yandex::Register - 允许在 Yandex 注册账号 |
| Remove bad accounts | ☑ | 删除无效账号 |
| Quick answers count | 0 | 爬虫工具针对每个查询应采集的最大问答(快速回答)数量 |
| Parse generative answer | ☐ | 是否抓取生成式回答(这会增加额外的子查询,从而降低整体速度) |
| Accounts | Only from "accounts.txt" | 选择账号工作方式:Always auto register - 始终自动“即时”注册账号,需在 SE::Yandex::Register preset 参数中选择配置好的预设。Auto register if no more in "accounts.txt" - 首先使用 accounts.txt 中的现有账号,如果用完则使用自动“即时”注册,为此需在 SE::Yandex::Register preset 参数中选择配置好的预设。Only from "accounts.txt" - 仅使用 accounts.txt 中的现有账号,如果用完则等待指定时间(Wait new accounts in "accounts.txt" 参数)直到新账号出现。Only by session_id from "accounts.txt" - 通过 Cookie 授权。 |
| Remove bad accounts | Always, except wrong login/password | 自动删除“坏”账号:Always - 始终删除。Always, except wrong login/password - 始终删除,除非 Yandex 提示用户名/密码错误。事实上,Yandex 可能会在 IP 被封锁时对完全正常的账号返回此类提示,因此可以选择保留此类账号以供重复使用。Never - 从不删除。无论选择哪种方案,在代理/浏览器错误时都不会删除账号 |
| Use sessions | ☑ | 使用会话 |
| Wait new accounts in "accounts.txt" | 0 | 等待 accounts.txt 中出现新账号的时间 |
| SE::Yandex::Register preset | default | 选择预设设置用于 SE::Yandex::Register |
| Force neuro | ☐ | 强制开启神经回答,类似于手动在“搜索”和“Alice 搜索”之间切换 |
