面对市场上很多假蜘蛛,我们改如何快速识别?一招搞定

20210919215243.png

以上是百度官方说法原文的截图,发布日期是2017年,时间虽远了点也可以供大家参考一下。最新有没有发布类似的文章,我没有去找。感兴趣的点击传送门查看原文!

传送门

这篇文章有三点信息,可以了解一下:

  • 第一,百度蜘蛛IP不固定,随时有新的出现,旧的是否关闭无关紧要,不在我们考虑范围内。

  • 第二,原文有两点列出,可以识别出是否是百度蜘蛛,其一,查看UA, 其二,反查IP。

  • 第三,给出一大堆官方的UA,节省大家时间,省着去网上一顿乱找,还不一定准确。

以上三点,我简单分析一下:

第一,我们可以知道百度会随时增加蜘蛛的IP,也就增加了我们通过IP作弊的风险了,如何通过IP作弊呢?

很多人或者有些出售中的程序,他们内置了能收集到的所有已知百度蜘蛛IP,通过判断访客IP进行选择性展示或跳转广告。

访客IP和蜘蛛IP库里对上了,就不跳广告,对不上就判断为自然流量访客非蜘蛛,再跳广告,看来这种招数不行了。

所以,如果你买别人的程序,他们只通过IP对比进行判断,那你只能猴子它爹~狒狒了(废废了)。

第二,官方给出明确方法来确定蜘蛛的IP,其中两步都需要做到,第一步判断UA是蜘蛛的UA了接着进行第二步。

判断UA不是蜘蛛的就可以确定不是了,因为相信了蜘蛛的人品,免去了第二步。

这时候你可能会有疑问了,第二步的意义在哪?如果访客UA是被模拟的百度蜘蛛,即便是假的也是不怀好意的人,当成蜘蛛展示正常页面即可,这样做也完全没有问题,很多人都是仅判断了UA,把真假蜘蛛UA都一网打尽。

但是,仅判断UA需要满足两个前提,一、你不怕别人看你页面仿你站和你竞争,二、你需要百分之百相信蜘蛛的人品不会假装成正常访客“钓鱼执法”。我是相信的,但我从来都是不想别人看我站点页面的,别人可以模拟伪装UA却无法模拟伪装Baiduspider的hostname。

第三,以下UA仅供参考,不太确定时效性。

移动UA:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

PC UA:

Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

新增渲染UA:

移动UA:

Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

PC UA:

Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

小程序UA:

Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)


留言评论

暂无留言