信息检索评价指标

来自《信息检索》
Julia讨论 | 贡献2010年5月17日 (一) 22:04的版本

跳转至: 导航搜索

检索性能评价是信息检索评价的重点和核心,而"相关性"与"相关性判断"是检索性能评价不可或缺的标尺与基准。从20世纪60年代的大型评价试验Cranfield,到今天的TREC评价平台,检索性能评价活动一直是以系统相关性判断为主导的,其间形成的许多评价指标也主要建立在系统相关性的匹配标准上,并一直沿用至今。其中,最著名的指标主要派生于检索系统性能评价用2*2表。

  1. 查全率(Recall Ratio,简称R)是衡量系统在实施某一检索作业时检出相关文献能力的一种测度指标,其计算方法为:

Recall=检出的相关文献量/检索系统中的相关文献总量=a/(a十b)

  • 注意,由于在系统的数据库中,针对某一提问的全部相关文献数量不能精确获知,R的计算结果一般都是近似值。 ’