GOOGLE搜索引擎蜘蛛的等级:
首先先谈下GOOGLE蜘蛛起源:
当GOOGLE搜索引擎刚建立之初,就拥有这一个非常强大的的服务器,
其每天放出大量的蜘蛛,我们称为1号蜘蛛,其抓取量抓取速度是非常的快,
对其整个互联网每天进行信息进行的采集,可见服务器的速度是多少快,其实最主要的是后期GOOGLE
将服务器延伸到了很多城市,所以现在你能发现GOOGLE的运算速率是超前的快.
服务器将采集的信息分类,整理.到庞大的数据库.
其中有个数据库都是用来存网站域名的.
域名只要被搜索引擎索引到,将自动存入此数据库.
此数据库是1号蜘蛛的核心.
其内部分为10个PR各等级的小数据库,虽说小数据库,但也是大的可怕-。=!
10个等级的数据库 其周期也不同
基本上以一个PR=4的网站来讲 1号蜘蛛爬行的概率也在7天一次.
所以基本你也会发现收录有大的幅度也是在7天内的某一天 .
细心的站长会发现其实有时候7天还是蛮准的,但只针对PR=4
越是PR高其周期越是短,越是PR低周期越长,
当然说到这很多站长有这样的疑惑.会觉得蜘蛛有时天天收录他的站
这里对其收录的也就是接下来要说的2号蜘蛛
2号蜘蛛往往是在1号蜘蛛爬行过程中放出去的,
主要针对于被1号蜘蛛爬过的网站的外部链接.
PS既然都说是2号蜘蛛 肯定其抓取力度要比1号小很多.
★ 当然不只是有2号,还有3号蜘蛛
所谓3号也就 A站1号蜘蛛爬行到B站,B站的2号蜘蛛爬行到C站
目前GOOGLE为了限制其无限的循环对于蜘蛛只分为这三个等级.并对其等级的抓取率有个很明确的标准
而且2号与3号蜘蛛有个抓取特点 基本以时间的先后顺序进行抓取
★ 比方讲:
A网站被1号蜘蛛爬行后的一篇文章最后时间为 2008-6-1
那当A网站被从别的网站过来的2号蜘蛛给爬行,首先有可能会对其收录的是
最近发表的几篇文章如: 2008-5-31等 2008-5-30等文章将会进行第2次,第3次的访问
之后再爬行2008-6-1以后的信息.如果你网站没有任何更新,它将对其近一个月内的更改内容进行2次爬行.
如果外部来的2号与3号蜘蛛越多,同一篇文章有可能会被爬上好几次.
以下为GOOGLE提供的官方数据<秘>
★ 1号蜘蛛
基本抓取率在5%~10%
基于PR=0 没有任何导入链接与提交时 有可能被抓取的周期在6个月~12个月不等
基于PR=1 没有任何导入链接与提交时 有可能每次被抓取的周期在4个月~8个月不等
基于PR=2 没有任何导入链接与提交时 有可能被抓取的周期在2个月~4个月不等
基于PR=3 没有任何导入链接与提交时 有可能被抓取的周期在1个月~2个月不等
基于PR=4 没有任何导入链接与提交时 有可能被抓区的周期在1周~1个月不等
当然没有任何导入链接的网站无法做到PR=4
最高也只有PR=3
上述此数据只是GOOGLE官方提供的一个基数.
意思也就是1号蜘蛛主动爬取你网站的周期数.
对于2号或者3号蛛爬取你的网站,也就根据你的导入链接而定.
所以你会发现你的网站有时天天在被更新.
★ 2号蜘蛛
基本抓取率是2.5%~5%<基于1号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问>
★ 3号蜘蛛
基本抓取率为1.25%~2.5%<基于1号蜘蛛与2号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问>
GOOGLE目前蜘蛛的等级分为三种
当然蜘蛛有不同的蜘蛛
这里单单只的是网页蜘蛛.因为我只对这个感兴趣.
SEO工具、SEO教程、SEM教程、SEO培训、SEO优化、SEO服务、SEM服务等方面的资料,让大家掌握更多搜索引擎优化、网站优化等方面的知识。
关注者
博客归档
-
▼
2008
(128)
-
▼
十一月
(127)
- 导致网站进沙盒的真正原因
- 单向链接对SEO意义和价值
- 网页title长度解密
- 淘宝网robots.txt拒绝百度蜘蛛抓取,抵制百度
- 中搜对百度采取屏蔽措施
- JavaScript对SEO的影响和处理办法
- 百度召开紧急会议应对央视“曝光门”
- 百度受央视曝光影响周一股价大跌25%
- 关键字“小事”做到百度排名第一的
- SEO实际运用-网站编辑
- 黑帽SEO是什么?
- SEO探索-seo与网站结构的关系
- 从SEO原则看网站优化
- 不用 SEO取得成功的10个步骤
- 百度排名NO.1是怎样SEO成功的?
- 搜索引擎如何给你的网站内容打分
- 网站建设中标题和页面描述的撰写技巧
- 三年站长生涯收入80万的实战总结
- 长尾搜索可能比预料得还要长
- 网站关键字热门与时效性的测试
- 巧用seo获得上万流量的技巧
- 谈谈国外网站赚钱的要诀
- 百度图片SEO:让流量在翻番
- Site网址首页不在第一位的原因
- 有效增加反向链接的5个方法
- 告诉你24种提高网站关键字排名的SEO技巧
- 有利于网站排名的设计建议
- seoer你该怎么学习你的竞争对手?!
- 超强外链提高pr资源共享!
- 10种在SEO之外获得网站流量的方式(译)
- 最权威的Google排名算法解密
- 卖什么又省心又容易赚钱
- 网站赚钱就靠广告行不行?
- 网站美观重要还是实用重要?
- 中文网站设计通病
- SEO难学的那部分
- 从SEO角度看网站重新设计
- 复制内容网页是怎样形成的?
- 搜索引擎统一Robots文件标准
- 用户体验与SEO
- robots.txt详细介绍
- SEO作弊的含义与常见方式
- 强势推出“评测网站的十个指标”
- Google官方针对网站SEO的建议
- 搜索引擎中文分词技术
- 如何避免中小企业提升网络营销成功率五大误区
- 网络营销相对传统营销有哪些优势?
- 为什么要建立网站地图?
- 网站被百度K了怎么办?
- 搜索引擎排名算法中必不可少的要素
- 揭秘影响Google排名的主要因素
- 中国SEO的前景如何?
- 什么是反向链接?
- Google优化圣经
- 搜索引擎排名算法中必不可少的要素
- 怎样为有内容的网站创建良好的用户体验?
- SEO优化的主要环节和步骤包括哪些方面?
- 网站更换新域名,怎样才不会影响原有排名?
- 网站排名下降的主要原因
- 搜索引擎对网站重复内容的看法及建议
- 链接架构的重要性
- 常见的SEO术语
- 目前最完美解决QQ卸载彩虹的方法
- 服务器对网站排名的影响
- .NET语言的选择
- .Net的精髓-XML和SOAP
- ASP.Net的几大热点问题
- Windows.NET Server: 远程访问
- 技术分析:.NET的优势与劣势
- 微软下一代网络服务器IIS7前瞻
- 代码大战:哪种语言会赢得开发的霸权?
- 技术分析:.NET的优势与劣势
- 用不着妄自菲薄 对ASP和ASP程序员的一些话
- 从本质上看网页(asp,jsp)的编写
- 一个用ASP生成html的新方法
- 一个基于web的QQ程序 2(xml+asp)
- PHP5的 SPL
- 连续正整数 算法实现
- 深入学习memcached
- php在apache中安装模式的区别:fastcgi和mod_php
- PHP与WEB服务工作的三种方式
- 深入PHP编译缓存
- 编译PHP手册的新办法
- 用于解决PHP 命名空间分隔符输入问题的USB设备
- 再论代码之美——PHP实战
- php 时间差8小时解决
- 自动编码转换
- ThinkPHP安全体系-委托认证和决策访问和RBAC
- 从URL路由、空操作和空模块看ThinkPHP对SEO的支持
- 模型自动验证和处理
- 多数据库支持
- 值得关注的ThinkPHP特性2:分布式数据库支持
- 讲解一个经过高手优化的MySQL数据库实例
- ASP实现网站智能分词搜索
- 编写简单的中文分词程序
- 中文分词搜索,asp拆词搜索,asp智能分词搜索
- 用存储过程实现删除数据表的部分记录
- MySQL存储过程SAVEPOINT ROLLBACK to
- 用一个存储过程实现分步删除数据表记录
- DB2数据库创建存储过程时遇到的错误现象
-
▼
十一月
(127)
没有评论:
发表评论