当前位置:首页 > 新闻资讯 > 站长休闲 > > 周杰:搜索引擎的发展就是三大部分的演变

周杰:搜索引擎的发展就是三大部分的演变

点击次数:13 次 发布日期:2008-12-26 10:07:32 作者:源代码网
源代码网推荐

源代码网整理以下我首先来介绍下搜索引擎发展的过程和趋势,搜索引擎整个的分成三个部分,第一个是信息收集(Crawler),第二是信息索引(Indexer),第三部分是信息查询(Querier)。整个的搜索引擎发展的历史,就是这三个历史的演变。最早的搜索引擎是雅虎的搜索引擎,雅虎的时候可以说信息收集靠的是人工,由用户自己收集网址,那时候就是一个网址的收集和展示,后来通过自动化方式查询网页,使整个的搜索过程变得比较快。

源代码网整理以下后来随着信息的爆炸,大家对搜索引擎的关注程度越来越高。最初的算法非常的简单,直到Google出现。Google当时提出了Page Rank的算法,这在搜索行业是个突破。那时候Google的运算速度非常慢,信息的索引建立得不够完善,查询速度是一秒到两秒,2000年的时候,Google做了大规模的技术改进,整个系统大幅度提高,Google跟雅虎正式建立合作。

源代码网整理以下后来发展的历史,一方面是在信息收集部分尽量多的收集信息,后来是尽量的使查询过程加快,在查询上算法不断的优化。

源代码网整理以下搜索引擎整个大方向的改进,基本上离不开这三个领域。前不久百度发布的阿拉丁计划,主要是在信息收集的层面,加大了信息收集广度。互联网最开始的时候是一个静态的网页,后来出现了动态的网页,我对阿拉丁字面的理解,就是把动态页面的整理更广了,不光是动态网页,还包括网页背后的数据库,感觉往这方面走,能把所有的信息收集到它的系统里。

源代码网整理以下这块对互联网也是一个挑战,信息的内容越来越多,通过什么样的渠道和方式,把这些信息从各个企业、网站,私有库里面汇总到总的搜索引擎的大系统里,这个是一个挑战,百度在往这方面走。

源代码网整理以下 源代码网供稿.

网友评论 (0)
会员中心
新闻资讯
本站推荐
新闻资讯之精华