网络信息检索效果评价

来自《信息检索》

Wangjt（讨论）2009年8月24日 (一) 13:08的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

跳转至：导航、搜索

目前，得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式，其中以查全率和查准率最为重要^[1]。

查全率、查准率

查全率(Recall ratio，简写为R)，是系统在进行某一检索时，检出的相关文献量与系统文献库中相关文献总量的比率，即:查全率=检出相关文献量/文献库内相关文献总量。
查准率(Precision:atio，简写为P)，是指所检出的相关文献占所有检出文

献的比率。

查全率和查准率是衡量检索系统检索效果的两个最重要的指标，两者结合使用就能够反映一个检索系统的基本检索效果如何。但是在实践中，两者往往表现出一定的矛盾性，因为查全率强调尽可能全地查出所有相关信息，查准率则强调尽可能准的查出相关信息，这两者在实施过程中一直是一对矛盾。
值得一提的是，在网络环境下，查准率的重要性有所提升，这主要是因为网络资源如此庞大，没有过滤作用的检索系统是起不到其应有的参考作用的。

收录范围

在传统检索效果评价中，数据库收录范围指标被作为衡量查准率的一项辅助指标，用以揭示数据库的涵盖范围。它的计算公式为“给定时间内系统收录的文献总量”比上“同期相关领域中的实际文献量”。网络环境给收录范围带来的最大的挑战就是“同期相关领域实际文献量”的确定的难度更加大了，同时，信息技术的发展也为收录范围提出了更多的挑战。首先，网络所带来的新型资源是多媒体、多语种、跨地域的，因而一个优秀的网络检索系统，其收录范围应随网上信息资源的变化而及时变化，而且应该为利用网络特色资源提供方便手段。其次，一些新型检索工具也为这一指标提出了新的问题。如:元搜索引擎，它是多个单一搜索引擎的集合，没有独立的数据库，主要依靠系统提供统一界面，构成一个一对多的分布式且具独立功能的虚拟逻辑机制。这就使系统内外的范围划定更加模糊。
由于收录范围其实是查全率、查准率等一系统评价标准的基础，所以它的改变，也会相应的引起查全率标准、查准率等标准一系列的变化。

输出形式

输出形式是系统所检出的信息的表达形式，通常有文献号、题录、文摘或全文等。输出的信息越多且便于浏览，用户就越容易做出相关性判断。由于人机交互过程中，无可避免地会出现理解上的偏差，而输出形式可以提供更详细一点的检索反馈，使用户可以在系统所提供的检索结果的基础上进行更进一步的筛选，或及时调整自己的检索策略。所以，输出形式应该成为网络信息检索性能评价的一个重要指标，检索工具应该能够灵活地定义检索结果输出格式。而且，利用网络环境的特点，检索工具如果能够提供诸如标题、URL、文件格式、语种、文摘等多种选择，以超级链接方式或可视化的形式提供用户选择的话，相信会对系统本身的查准率提供一个修正。

↑ 熊回香.网络信息检索及其发展[D].武汉：华中师范大学，2003

取自“http://tuan.pub:88/index.php?title=网络信息检索效果评价&oldid=424”