笨小子's Blog

SEO工具、SEO教程、SEM教程、SEO培训、SEO优化、SEO服务、SEM服务等方面的资料,让大家掌握更多搜索引擎优化、网站优化等方面的知识。

2008年11月28日星期五

导致网站进沙盒的真正原因

沙盒(Sandbox)机制以前是google特有的专利;但是现在其他的搜索引擎也慢慢采用了这一技术。长期做百度的SEOer现在可能也慢慢发现百度也存在这一现象了,虽然百度未对此作出任何的表态。  沙盒站点的具体特征从以下几点来确认:  其一:习惯操作google管理员工具的朋友可以看一下一些数据,最为参考。能看出一些属于沙盒很明显的表现特征:  1.抓取统计信息。  Google管理员工具能统计网站3个月内的每天抓取页数、每天下载的千字节数、以及下载页面所用的时间。其实也就是每天的网站抓取数量、抓取内容的大小以及抓取内容所用的时间。这些数据在3个月内形成的线性示意图,充分而且直观的展现了一个网站收录波动图。进沙盒的站点在这里的表现是和平常一样的,并不会出现太大的变化。如果变动过大,可以排除网站进沙盒。  2.Googlebot看到的内容  这里我们能清楚的看到网站因进行SEO操作之后,网站内部优化和外部链接操作出来的关键词结果。进沙盒的站点,在这里的表现也是正常的,不会因为网站主要推的关键词是SEO而显示成其他词语。  进了沙盒的站点在google的管理员工具统计的信息方面和正常的站点是相同的,不会存在网站不被收录,或者K掉页面,甚至关键词混乱。  其二:网站排名状况很差。  这个主要表现在,任何关键词在搜索引擎上基本无排名。不论是网站的目标关键词还是网站的冷门关键词都是如此。  总结以上简单但明显的两点就是:网站收录状况良好,但是网站关键词如昙花一现再无踪迹或者从头至尾无任何排名。  导致这样的结果,可以从这两点上进行分析:  1. 网站的收录状况好。影响网站收录的直接因素为网站的内容质量和外部链接,如果是网站的内容质量导致网站收录良好的情况下,网站文章标题的关键词组的排名会比较理想,不会无任何排名。所以进沙盒的站点网站收录良好的直接原因是网站的外部链接操作的结果。  2. 网站关键词排名昙花一现或者至始至终无任何排名的对于一个进行SEO操作的网站是不太符合实际的。能对网站进行操作的SEOer们至少都掌握一些影响搜索引擎排名的因素。一旦进行了网站优化操作的站点比没有进行优化的大多站点在搜索引擎上的排名都是有很大优势的。所以出现这种问题的原因就是在SEO的操作过程中过度了。现在没有人会对网站进行关键词叠加,隐藏关键词等粗浅等作弊方式方式的优化。这些因素都可以排除在外。  基于以上两点,网站进沙盒的因素只能出现在网站外部链接的操作方面了。在这一环节中,不确定因素过多,所以一个没有大量实践基础和经验的SEOer是很少能准确拿捏的。外部链接的数量应该控制在多少?外部链接在什么时候做什么类型的链接?哪些外部链接资源有用?哪些外部链接资源无效?等诸多的因素,让外链连接操作变成了外部链接数量的比拼,这样一个网站很容易被做进沙盒。  外部链接的操作是导致网站进沙盒的致命杀手。过少不起作用,过多进沙盒。只有准确的拿捏住一个网站的外部链接的承受能力,以及哪些外链最有效才能让SEO工作起到事半功倍的效果。在网站外链的操作过程中,是网站优化的重要环节,不能因为操作不善而让这个致命的杀手大大延迟网站关键词的上次周期,甚至导致网站被搜索引擎删除。

单向链接对SEO意义和价值

这种单向链接与友情链接的区别很明显,就是只有“进”没有“出”,所以对于大部分人来说都会认为这样的链接对于网站本身没有坏处,或者说是好处多多,不过对于这个看法我多少有些异议,起码是不能认同。  首先还是说一下好处,好处就是做seo的人都知道,我说了也没啥意义,浪费篇幅,over。  然后是有可能存在的不良影响,举个例子,也是前几天我在seo无题站答疑群里面给一个朋友举的例子(广告一个:seo无题站每周五答疑群群号:40816143)。  把网站比做人,把搜索引擎对网站的了解和打分机制的部分比做一个侦探事务所或者调查公司,外链,实际上就是别人的网站对你的链接,我们将其比作有多少个人认识你知道你。  通过调查,出现这么几种情况:第一个,发现你很有名,中国平均10个明星有8个认识你,100个老百姓有80个知道你,10个国家领导人有5个提到过你,那么OK,你就是你所做的这个行业的权威人士了。(负面内容的网站不算在内)  第二种情况:调查来调查去,只发现除了你的家人同学没人认识你(质量不是很高的友情链接),那么你也就只是个普通人,保持观察。  第三种情况:通过调查,发现平均100个黑社会的有80个认识你的,10个贩毒里面有5个熟知你的,10个监狱囚犯跟你有过关系的,那么。  还有很多种情况,我们暂不提出来,只提出来这三个比较具有代表性的,其中各项比拟内容那个所指的是什么大家心里有数我就不多解释了。  第一种情况我想不用多说大家也能理解,第二种情况也是很多中小站长目前的状况也不用提,关键是第三种情况,也就是一些进入了外链误区的朋友所面临的情况:单向外链多就是好!反正我没链出去,不会受惩罚。但是看了我上面的那个比喻,你还认为不会受到惩罚么?  一个站点大部分的外链如果来源于一些黄色网站,非法网站,六XX网站,垃圾网站,那么换成你自己是搜索引擎,你会怎么认为?再者,正如ZAC所说,每个搜索引擎的核心技术人员也都是一顶一的聪明人,扪心自问你自己包括我本人在内能拍着胸脯说自己比其中哪个人更聪明或者聪明多少?  就目前而言,已经可以看到搜索引擎对于单向外链的识别能力越来越强,百度由于人工干预的问题会在很大程度上直接把垃圾外链过多的站点干掉,这个血的教训多到已经不想提了,而google相对温柔的表现并不是漠视不管而是崇尚技术用户体验的google还没有找到一个完全能够分辨这类站点而与此同时不错杀好网站的方法,而一旦google找到了这种方法或者google改变了这种温柔的态度,谁又能够保证google不会像百度一样?

网页title长度解密

百度:60个字节。谷歌:66个字节。搜搜:66个字符。雅虎:64个字节。微软:46个字节。114:45个字符。搜狗:56个字符。有道:56个字符。中搜:52个字符。
注意:两个汉字等于一个字节。其中要数Google对Title的最长。总结下来,也就是Title的长度一般为25~33个字之间。当然,这个数字是,当别人搜索你的Title内的Keywords时,搜索引擎会完全的显示你的标题。但是,当你超过的时候,默认的显示是从左到右,最右边是省略号。据Chw的经验,如果你的Title超过这个字数的要求的话,别人搜索你的Title中处于后方的Keywords时,百度会自动在标题显示相关的Keywords出来,给前面那些不相关的用省略号显示!

淘宝网robots.txt拒绝百度蜘蛛抓取,抵制百度

据其他网站新闻报道,淘宝已通过robots.txt拒绝百度蜘蛛抓取,抵制百度,举起中国门户网站反抗本土搜索大颚百度的大旗。
本人打开www.taobao.com/robots.txt发现,淘宝网确实已经屏蔽了百度“蜘蛛”。据了解,“蜘蛛”是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。而如果一个网站屏蔽搜索引擎蜘蛛的话,就意味着该家搜索引擎无法获取这家网站的内容。   对于淘宝屏蔽百度蜘蛛,淘宝网公关总监卢维兴表示,淘宝上有一些用户的隐私数据是肯定不允许搜索引擎抓取的。对淘宝是否完全屏蔽了百度的索引,卢维兴表示对此还不清楚。 有意思的是,阿里巴巴集团于昨日正式将淘宝网和阿里妈妈网站合并运营。分析人士认为,这是淘宝网为应对百度即将推出的C2C业务所做的布局之一。百度CEO李彦宏曾在第二季度财报电话会议上表示将于年底推出百度C2C平台。 分析认为,中国本土几大门户网站与百度的合作关系都甚微妙,既不想依赖,又不想失去。又据分析人士表示,百度的异军突起起先是依靠几大门户的支持,之后反客为主。 一互联网专家对笔者表示:对于搜索引擎行业,几大门户皆想染指,却对于他们共同的敌人百度来说总是不堪一击。对于这次淘宝网的反击,有望引导几大门户全力围剿百度。
有第一个吃螃蟹的就会有第2个。试想一下,如果有一天网民在百度上搜索新浪找不到新浪,搜索163找不到163,搜索淘宝找不到淘宝,搜索中国seo找不到中国seo,他还会使用百度吗?

中搜对百度采取屏蔽措施

新浪科技讯 9月12日上午消息,继淘宝网及SNS网站校内、海内后,中搜今日也加入屏蔽百度的队伍行列。中搜相关人士表示,互联网企业应该联合起来,抵制百度商业机制影响搜索结果的行为。  9月8日下午,在网上已就屏蔽百度一事议论的沸沸扬扬后,淘宝宣布正式彻底屏蔽百度搜索,谷歌以及其他搜索则不受影响。这一官方表态,随后立即遭到百度C2C方面的激烈反弹。  百度电子商务事业部总经理李明远接受新浪科技专访时,毫不客气地指出,对淘宝不顾其交易平台卖家切身利益而屏蔽百度蜘蛛爬虫的举动感到遗憾。  随后,校内网、海内网、51.com等SNS网站也加入屏蔽百度队伍行列。这场由百度、淘宝围绕C2C市场展开的较量,引发出一系列对百度竞价排名的谴责。  市场人士认为,百度商业操作的竞价排名机制使搜索引擎失去应有的公正,大量垃圾站和个人娱乐站点利用百度的SEO规则,将自己的排名推高,而真正做精深内容的个人主页、BLOG站点反而失去应该得到的地位。  而此时宣布跟进屏蔽百度的企业,有借机“炒作”之嫌。业内专家表示,很多屏蔽行为是发自企业内需,借此机会,引发业内关注长期以来百度竞价排名的不公正,有利于互联网行业更规范的向前发展。

JavaScript对SEO的影响和处理办法

JavaScript在SEO中是一个很头疼的问题,一方面我们在网页制作中需要使用JavaScript来实现绚丽的特效,而一方面JavaScript又会对搜索引擎的抓取分析造成不好的影响。Google的官方文档中很清楚的说明,如果在html中过多的使用 JavaScript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂功能会使搜索引擎抓取工具在抓取网站时可能会遇到问题。
  Use a text browser such as Lynx to examine your site, because most search engine spiders see your site much as Lynx would. If fancy features such as JavaScript, cookies, session IDs, frames, DHTML, or Flash keep you from seeing all of your site in a text browser, then search engine spiders may have trouble crawling your site.
  http://www.google.com/support/webmasters/bin/answer.py?answer=35769
  Google Site Search isn't able to index content contained in JavaScript. The general rule for making sure that a web page can be indexed by Google is to ensure that all of the text that needs to be indexed is visible in a text-based browser, or a browser with JavaScript turned off.
  http://www.google.com/support/customsearch/bin/answer.py?answer=72366
  不仅是Google,yahoo在官方文档中也有类似的强调:
  尽量使用搜索引擎能够识别的文本信息,避免过多的JavaScript、Cookie、框架、DHTML 或 Flash 等复杂技术。
  http://help.cn.yahoo.com/answerpage_2911.html
  百度虽然没有明确的说明,但是经过大量的实践,百度也是无法对JavaScript进行识别的。
  这样就造成了一个问题,网页中过多的JavaScript代码无疑是对搜索引擎分析网页内容增加难度,如果网页中的链接也是有不少JavaScript组成的话,那么搜索引擎甚至无法顺着链接去抓取网页。这样的话,过多的使用JavaScript就造成了以下的影响:
  1、对搜索引擎分析网页内容造成了干扰。2、影响关键词密度。3、严重妨碍搜索引擎抓取网页。4、影响由链接产生的网页权重分布,这一点在PageRank上通常会有体现。
  对抓取和链接权重所造成的影响,还可以用外链来弥补,但是第一第二点却是不容易挽救的。
  如何在不影响网页效果而又对搜索引擎友好的前提下使用JavaScript,从而不影响SEO效果呢?
  1、绝对避免导航及其他链接使用JavaScript。导航和链接是搜索引擎抓取网页的赖以生存之本,如果搜索引擎无法抓取网页,则代表了网页不会出现在索引结果中,也就无从谈起排名了。
  2、尽量避免对内容使用JavaScript。尤其是与关键词相关部分的内容,应该尽量避免使用JavaScript来展现,否则毫无疑问是要降低关键词密度的。
  3、实在需要使用JavaScript的部分,将这部分JavaScript脚本放在一个或几个.js文件中,这样能够避免干扰到搜索引擎的抓取和分析。
  4、实在不能放在.js文件中的部分JavaScript脚本,将它们放在html代码的底端,之前,这样使搜索引擎分析网页时最后才会发现它,降低对搜索引擎的干扰。
  以上的一些方法是消除JavaScript对搜索引擎的不利影响。其实反过来说,一个事物通常有利也有弊。JavaScript的使用也是这样,不一定使用JavaScript就一定是不好的,在一定程度上去利用JavaScript,反而对SEO有很好的作用,也就是正面的作用。
  我们有说到搜索引擎无法对JavaScript进行识别(虽然Google目前做到了对少量简单的JavaScript代码做出辨别,但那也应该只是Document write之类的简单代码)。那么换一个角度来说,我们完全可以利用JavaScript来过滤一些垃圾信息。
  何谓垃圾信息?从SEO的角度来说就是不仅对搜索引擎抓取分析没用,还会对关键词密度造成干扰等不利的信息。通常这些“垃圾”信息包括:广告、版权申明、大量导出链接、与内容不相关的信息等等。我们可以将这些垃圾信息通通扔进一个或数个.js文件中,从而降低对页面实质内容的干扰,提高关键词密度,向搜索引擎展示页面内容的核心。

关注者