无需代理ip查询搜狗任务触发验证码机制并识别通过
如果我们想做一些搜狗页面的一些数据分析,比如网站关键词排名,挖掘相关搜索词等任务,用代码自动化请求时间过长,会触发搜搜验证码机制。对于这个验证码,可以识别验证码并请求通过。
遇到这类情况,可以分析一下接口,经过分析,在代码中进行还原
请求data参数中suuid和auuid在页面源码中可以获取到,r、p参数是url请求字符串,code是验证码。主要的问题就是code了,首先是获取验证码图片,可以通过一下请求获取到
获取到的原图是这样,需要进行灰度处理,这样识别准确率会高一点
在代码中对验证am图片进行灰度处理
运行代码后,识别通过后,系统会返回解封成功..说明已经识别成功了,接下来保持session会话,就可以继续进行查询任务,可以看到查询到关键词的排名结果。
在搜狗页面进行验证,可以看到排名结果和查询的是一致的。
需要此源码的或者了解其他内容可以到www.seoyiwu.com中我的博客了解更多内容