« 上一篇下一篇 »

通过Canonical解决网页重复

网页链接地址重复一般产生于一些大型网站建设初期网络构架不合理造成了,也有一些是由于商务需求而刻意为之,但无论什么样的理由,最终的结果都是造成了网页链接地址的重复,表现的结果就是同样一篇文章对应两个或两个以上的URL地址,在搜索引擎中认为此网站存在镜像。

canonical

一个网站如果出现了大量的镜像内容,会在一定程度上造成原创的主页面权重降低,在搜索引擎的表现结果无竞争优势。同时,如果出现大量的镜像,而无对应的解决办法,那么可能会导致网站被K。当然对于一些不需要搜索引擎的网站(如淘宝)或有大量高技术的人才的公司(新浪等),他们都不担心该问题,但作为一个还需要搜索引擎,还需要以流量为标杆的网站,避免大量内容的重复就变得非常有必要了。

目前,经秦爱测试,对于谷歌、雅虎、BING,在META标签中使用Canonical能够有效的排重,效果可以说立杆见影。

Canonical的语法大概是这样的,中使用link语句将你要重点强调的URL地址指定,例如:<link rel="canonical" href="http://www.newsunday.com/" />

如果该URL动态地址,且有一个以上参数,那么在符合W3C标准的情况下,要将“&”符号要转换为“&”

如果你想了解更多关于URL地址规范的内容,可以查看谷歌中文博客管理员工具中的“指定您的URL范式”,这里面有更加详细的介绍

canonical在PR传递中与301有着同样的作用,但与301不同的是,经服务器端301定义后,仅能保留一个网页,而使用canonical后,可以实现两个网页同时存在。很多时候,有很多人都认为有这种想法和做法的人不是有病吗?事实上正如本文最开始说的内容一样,这种做法是必然且必须的。

在本文的结尾,秦爱很想找到一个百度消重的办法,但实事上秦爱到现在也没有比较合适的办法,甚至通过Robots.txt牺牲了近两年半的数据也无法消除URL地址在百度搜索结果中的重复问题。如果您是百度搜索优化的高手,不妨指教一二。

附:在遇到这个问题的时候,是zouyun提醒我使用Canonical标签的,在此感谢。