SEO工具、SEO教程、SEM教程、SEO培训、SEO优化、SEO服务、SEM服务等方面的资料,让大家掌握更多搜索引擎优化、网站优化等方面的知识。

2008年11月26日星期三

搜索引擎对网站重复内容的看法及建议

“搜索引擎对重复内容的网站如何处理”一直都是SEO界的朋友经常关注跟讨论的热点话题。大家也知道,搜索引擎也不喜欢重复内容的网页,那么,什么样的重复内容网页才会被处罚!现在,我们进入今天讨论的话题。
在Google看来,有一些重复内容页面的处罚是和抄袭其他网站的内容有关的,比如完全抄袭并且发布其他网站的内容,或者在完全没有提供任何其他附加价值的情况下发布这些抄袭的内容。无论是Google,还是其他的搜索引擎,都不提倡这种做法。其中,在Google网站管理员指南中就谈到了一些:
1、请不要创建含有大量重复内容的多个页面、子域或者域;2、请避免使用那种“一个模子印出来”(cookie cutter)的方式创建网站,比如没有或者很少原创内容的联属计划;3、如果您的网站参与联属计划,请确保您的网站可提供附加价值。提供独特且相关的内容,使用户首先有理由访问您的网站。
一般情况下,重复内容如果是意在欺骗用户并操纵搜索引擎结果的,那么,Google会在相应网站的索引和排名中进行适当的调整,网站的排名可能会受到影响,或者可能从Google索引中完全删除,删除后不再显示在搜索结果中。否则,Google都不会对有重复内容的网站采取特别措施。
为了确保访问者看到您希望他们看到的内容,使重复内容问题得到更好的解决,Google建议我们采取以下措施:
1、考虑拦截网页,使之不编入索引:如果您不希望 Google 算法确定文档的"最佳"版本,而是希望指示我们选择您的首选版本。例如,如果您不希望我们对您网站文章的可打印版本编制索引,请禁止这些目录或在 robots.txt 文件中使用正则表达式。
2、使用 301:如果已调整网站结构,请在 .htaccess 文件中使用 301 重定向("永久重定向"),以智能重定向用户、Googlebot 和其他抓取工具。(在 Apache 中,可以使用 .htaccess 文件进行此操作;在 IIS 中,可以通过管理控制台进行此操作。)
3、保持一致:尽量使内部链接保持一致。例如,请勿链接到 http://www.example.com/page/、http://www.example.com/page 和 http://www.example.com/page/index.htm。
4、使用顶级域名:为了帮助我们提供最适当的文档版本,请尽量使用顶级域名来处理国家/地区特定内容。例如,在 www.example.de、www.example.com/de 和 de.example.com 中,我们更容易知道第一个网址包含德国内容。
5、谨慎联合供稿:如果您在其他网站上联合供稿,在每次搜索中,Google 将总是显示我们认为最适合用户的版本,这可能是也可能不是您首选的版本。不过,这有助于确保内容的每个联合供稿网站都包括一个指回原创文章的链接。您还可以要求使用联合供稿材料的网站使用 robots.txt 拦截其网站上的版本。
6、使用网站管理员工具向我们说明您希望如何对您的网站编制索引:您可以向 Google 说明您的首选域名(例如,www.example.com 或 http://example.com)。
7、最大限度减少样板重复:例如,不在每页底部提供冗长的版权文字,而是提供简短摘要,然后链接到提供详细内容的网页。
8、避免发布空白内容:用户不喜欢看到"空白"网页,因此,请尽量避免使用占位符。例如,请勿发布尚无真实内容的网页。如果创建了占位符网页,请使用 robots.txt 拦截这些网页,使其不被抓取。
9、理解自己的内容管理系统:确保熟悉自己的内容如何显示在自己的网站上。博客、论坛和相关系统往往会以不同的格式显示相同的内容。例如,某个博客条目可能显示在博客主页中、存档网页中和标签相同的其他条目的网页中。
10、最大限度减少相似内容:如果您有多个相似的网页,请考虑扩展每个网页,或将这些网页合并成一个。例如,如果有一个旅行网站包含两个城市的不同网页,但两个网页上的内容相同,则可以将这两个网页合并为关于两个城市的一个网页,也可以扩展每个网页,使其包含相应城市的独特内容。
总而言之,网站上的重复性内容会以多种方式影响您的网站。但是除非您是恶意抄袭造成内容重复,否则这些方式不会构成对您网站的处罚。这也意味着,当您清除了无恶意的重复性内容时,您无须向Google提交重新收录的请求。

没有评论:

关注者

博客归档