搜索引擎
来自《信息检索》
搜索引擎概念
- 搜索引擎是指运行于因特网上,以因特网上各种信息资源为对象,以信息检索的方式提供用户所需信息的数据库服务系统。搜索引擎所处理的信息资源主要包括WWW服务器上的信息资源,另外还包括邮件列表和新闻组(BBS)等信息[1]。
搜索引擎的发展
- 因特网发展的初期,用户一般通过浏览的方式来寻找自己需要的信息,一些专业网站也会有专门的栏目或在页面用下拉菜单等形式列出一些相关的网站提供导航服务。也有网站专门进行网络信息资源的发现和人工整理,如学科信息门户、开放目录等。随着网络信息资源的爆炸性增长,网站越来越多,用户对信息需求的信息粒度越来越细、领域越来越宽,这种人工整理网络信息资源的模式不能适应网络信息资源的快速增长。信息技术的发展使得基于计算机技术的网络信息检索工具应运而生,使得用户可以快速检索和获取因特网上的海量信息资源。
搜索引擎的组成和原理
- 逻辑上可以把搜索引擎分为三个组成部分:网页搜集引擎、索引引擎和查询引擎[1]。
- 网页搜集引擎用来在因特网上收集网页。网络蜘蛛(SPIDER,或称为网络机器人:ROBOT)就是指网页搜集引擎;
- 索引引擎用来对收集到的网页建立索引;
- 查询引擎提供用户访问的查询界面服务。
- 从搜索引擎的组成部分看,其基本原理是首先通过网络蜘蛛根据一定的规则在网上“爬行”,收集网页信息;然后通过索引引擎对收集的网页进行自动标引,建立索引,形成网页索引数据库;用户通过查询引擎进行信息的检索。
搜索引擎评价与研究网站
- 搜索引擎观察:http://searchenginewatch.com/
- 搜索引擎评价:http://news.web20share.com/tag/search
- 中文搜索引擎指南网
- 维基百科搜索引擎列表
参考文献
参与本页讨论
用户留言: |
目前暂无留言 |
新增留言 编辑留言 |