搜索引擎
来自《信息检索》
搜索引擎概念
- 搜索引擎是指运行于因特网上,以因特网上各种信息资源为对象,以信息检索的方式提供用户所需信息的数据库服务系统。搜索引擎所处理的信息资源主要包括WWW服务器上的信息资源,另外还包括邮件列表和新闻组(BBS)等信息。
搜索引擎的发展
- 因特网发展的初期,用户一般通过浏览的方式来寻找自己需要的信息,一些专业网站也会有专门的栏目或在页面用下拉菜单等形式列出一些相关的网站提供导航服务。也有网站专门进行网络信息资源的发现和人工整理,如信息门户、开放目录等。随着网络信息资源的爆炸性增长,网站越来越多,用户对信息需求的信息粒度越来越细、领域越来越宽,这种人工整理网络信息资源的模式不能适应网络信息资源的快速增长。信息技术的发展使得基于计算机技术的网络信息检索工具应运而生,使得用户可以快速检索和获取因特网上的海量信息资源。
搜索引擎的组成和原理
- 逻辑上可以把搜索引擎分为三个组成部分:网页搜集引擎、索引引擎和查询引擎。
- 网页搜集引擎用来在因特网上收集网页。ROBOT 或SPIDER 就是指网页搜集引擎;
- 索引引擎用来对收集到的网页建立索引;
- 查询引擎提供用户访问的查询界面服务。