截词检索
来自《信息检索》
Julia(讨论 | 贡献)2010年5月9日 (日) 21:57的版本 (创建新页面为 '*截词检索(Truncation、Wildcard Symbols):利用检索词(关键词、主题词)的词干或不完整词形进行查找的过程为截词检索。它可以起到扩…')
- 截词检索(Truncation、Wildcard Symbols):利用检索词(关键词、主题词)的词干或不完整词形进行查找的过程为截词检索。它可以起到扩大检索范围,提高查全率,减少检索词(关键词、主题词)(关键词、主题词)的输入量,节省检索时间。尤其在英文检索系统中检索时,若遇到名词的单复数形式,词的不同拼写法,词的后缀变化时,均可采用此方法。
- 截词的方式有多种,可以分为有限截词、无限截词和中间截词。
- 有限截词:有限后截词主要用于词的单、复数,动词的词尾变化等。将“n”个截词符放在检索词(关键词、主题词)的词干或词尾可能变化的位置上。
- 中间截词:一般来说,中间截词仅允许有限截词,主要用于英、美拼写不同的词和单复数拼写不同的词。例如:wom?n woman women
- 无限截词:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。在检索词(关键词、主题词)干后加1个截词符 “?”或“*”。表示该词尾允许变化的字符数不受任何限制。例如:comput* 可检索出 computer、computing、computers、computering、computeriation 等词的记录。
- 任何一种截词检索,都隐含着布尔逻辑检索的“或”运算。采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将影响查准率。另外,不同的检索系统使用的截词符不同、各数据库所支持的截断类型也不同。