当前位置:淡墨SEO首页 > SEO软件 > 百度蜘蛛ip220和116段质量高,抓取很多

百度蜘蛛ip220和116段质量高,抓取很多

淡墨SEO1年前 (2024-05-30)SEO软件3913411

通过对服务器日志的分析,发现百度蜘蛛ip段116.179.32.*和220.181.108.*两段百度蜘蛛抓取量很多,也是主要的抓取ip段。我们从日志中可以清楚的看到大量的这两个ip段蜘蛛在访问网站的内页。


我们在服务器中,下载网站的日志文件,再把日志文件导入到特定的日志分析工具中,可以看到百度蜘蛛抓取网站页面的情况。可以通过下图,蜘蛛ip地址主要集中在220.181.108.*和116.179.32.*。这两个蜘蛛ip在大量抓取网站的内页。

image.png


通过ip138网站去分析ip的来源,其中116段ip是来自山西百度蜘蛛。220段ip是来自北京百度蜘蛛。都是百度蜘蛛标识。所以抓取上都是正确的。


image.png


image.png


这两段ip的百度蜘蛛抓取量很多。基本上百度方面的蜘蛛就已经抓取了2000多次了。不过发现了一个方法,可以提高220段蜘蛛的抓取量。就是百度站长平台抓取诊断里可以手动提交链接,然后就会发现220ip蜘蛛就会实时的抓取网站页面。

image.png

image.png


百度抓取诊断提交链接,每周只能提交70次,数量上有了很大的限制。不知道是出于什么原因限制次数。但是如果我们有大量的站点,或者批量绑定泛二级域名。这样提交的量就会有很多了。那么这里就要用到批量二级域名绑定软件了。可以自动化的进行二级域名批量绑定、删除、推送。



image.png




绑定完站点,其次进行10次主动推送,进行70次抓取诊断提交。然后进行删除处理,再去自动重复操作这一流程,这样就可以达到大量提交站点的目的了。







扫描二维码推送手机访问

文章内容均为原创,禁止转载!

本文链接:http://danmoseo.com/news/75.html

标签: seo软件

相关文章

js逆向百度旋转验证码并通过验证

js逆向百度旋转验证码并通过验证

在公众号之前的一篇文章写到用pyppeteer模拟轨迹进行识别。https://mp.weixin.qq.com/s/aHeYmRMx4NIfN5shch-WfA 大家可以自行前往学习了解。本次带来一个更加轻松的识别通过,就是通过js完成距离通过验证。下面就主要讲解一下思路,具体操作验证还...

自动过旋转验证码并查询关键词排名

自动过旋转验证码并查询关键词排名

如果用程序持续查关键词排名的话,肯定会遭遇百度反爬机制,反爬手段就是旋转验证码,需要过了旋转验证码才可以继续爬取,在之前已经逆向解决了旋转验证码,那么查询排名就可以持续性自动化进行。如果不过旋转验证码,那么就要买大量的代理ip去替换ip查询,而且这种做法查询过程中也会遇到反爬,并且查询速度收代理ip...

百度贴吧包含指定关键词回复内容提取软件

百度贴吧包含指定关键词回复内容提取软件

这几天,有个用户找我做百度贴吧回复采集,将出现的验证码也识别通过,那么我正好有这个旋转验证码逆向源码,可以接入到百度贴吧中,只要出现验证码逆向通过就行了。爬虫采集的问题不大,主要是旋转验证码需要接入,接入的规则也是要根据网页的参数需求。视频演示:贴吧采集就不细说了,这里我用了多线程采集,速度已经非常...

百度站长平台js逆向登录解析

百度站长平台js逆向登录解析

在我们使用百度站长平台看看网站数据信息的时候,肯定要先登录才能获取,那么就需要在网页上进行登录,然后才能看到网站一些信息以及做一些操作比如二级域名绑定,抓取诊断、关键词查看等。那如果要代码进行这些操作的话,要解决逆向登录的问题,或者不解决登录的话,在网页上获取cookie进行复制再进行代码操作。本次...

利用pyppeteer模拟浏览器自动化二级域名绑定任务

利用pyppeteer模拟浏览器自动化二级域名绑定任务

最近百度一直在更新,取消dns、post请求403,更改滑块验证码等措施,导致现在发包绑二级频频被限制。既然这样,直接索性搞一个自动化浏览器的模式来绑定二级。此次用到的是pyppeteer浏览器框架。此框架异步处理 速度还是挺快的。而且不需要下载浏览器驱动,非常方便哈。视频演示:首先是百度二级域名绑...