27
4006-5666-83
当前位置:首页 > 资讯 > 建站知识

浅谈百度抓取淘宝那点事

2012-02-06 酷站科技

大家都了解大约是“百度有啊”发布以前,淘宝为了更好地防止百度搜索故意爬取,立即屏蔽掉百度爬虫,也就是那时候闹得议论纷纷的robots.txt协议书 。

就算是如今进入淘宝的robots.txt协议书,仍然能够 见到淘宝网仍在屏蔽掉百度搜索的搜索引擎蜘蛛。

但是实际上确实这般么

事实上淘宝网的robots.txt文件压根对百度爬虫起不上一切功效。

小兄弟推断百度搜索往往那么做是由于百度搜索充分考虑发展战略方位的难题,由于查寻了一下发觉一些著名店面在百度的排行都很非常好。足够证实百度搜索对淘宝网这类店面的必要性。更为中国戏曲化的是天猫商城(淘宝网)也是应用robots.txt协议书的。一样屏蔽掉百度爬虫。

也有一种很有可能便是淘宝及其天猫商城的权重值太高了,造成了百度爬虫不遵照百度搜索引擎协议书而开展的爬取。但是针对这类事儿能够 想到到前些生活,一淘网故意爬取京东及其新蛋网等的产品数据信息,也不是遵照百度搜索引擎标准的。

直到如今京东等也在屏蔽掉一淘网的搜索引擎蜘蛛,

我想说的是如今的百度搜索引擎为了更好地本身权益而不遵照互联网协议的标准,是值得注意的,号召这类互联网技术大企业能在全部IT领域塑造树立。

来源于申明:以上内容一部分(包括照片、文本)来自互联网,若有侵权行为,请立即与本网站联络(010-57218159)。
如没特殊注明,文章均为酷站科技原创,转载请注明来自http://www.bjkuzhan.com/jianzhanzhishi/4640.html
联系专业的商务顾问,制定方案,专业设计,一对一咨询及其报价详情
服务热线服务热线 4006-5666-83
联系我们 contact us
4006-5666-83
400-6566-683 — 海淀营业部
400-6566-683 — 昌平营业部
+

酷站科技为你提供上门/网站策略方案

留下联系方式,我们将会在一个工作日内与你联系

隐私条款信息保护中,请放心填写