用户:缘

来自《信息检索》
讨论 | 贡献2010年11月26日 (五) 15:15的版本

跳转至: 导航搜索

==美国记忆==
数字图书馆作为知识经济的重要载体,其核心是以各种高新技术为基础的数字资源、数字资源库和数字资源库群。数字图书馆知识服务的发展方向是满足特定群体的深层次需求的,专业化、智能化的服务,是需要按照知识概念内在的体系,将各类信息资源按知识概念和学科门类在相互之间建立起丰富的语义关联,形成各种类型的知识库,从而建立起超越地域限制、具有可扩展性的巨大的“知识网络”,满足不同群体、用户在更广的范围内、更具专业化与个性化的水准上获取知识服务的需求。因此,数字资源建设以及对这些数字资源的分析、组织、关联后形成的数字资源库、知识库等是数字图书馆建设中不容忽视的工作重点所在。
---------------------------------------------------------------------------------------------------------------------------------------------------------

什么是美国记忆

  • 历史文化资源作为人类文明的宝贵财富是一个国家民族精髓所在, 因此其保藏及利用问题, 一直是世界各国共同关注的问题。近年来, 数字化技术的日趋成熟为解决历史文化资源的保存和共享问题提供了理想途径, 许多国家也纷纷开展相关项目研究和探索性尝试。
    • “美国记忆” (American Memory) 即美国国会图书馆正式启动的国家数字图书馆项目 (NationalDigitalLibraryProgram, 简称NDLP)。该项目旨在让“所有的学校、图书馆、家庭同那些公共阅览室的长期读者一样, 能够在所在地便捷地接触到这些对他们来说崭新而重要的资料, 并按个人要求理解、重新整理和使用这些资料”。
      • "美国记忆" (AmericanMemory) 是美国国会图书馆在数字图书馆领域的一次尝试, 也是目前为止这个领域规模最大的一次尝试。它于1990年正式启动, 到2000年 4月数字化了340万件馆藏, 同年12 月可以在万维网上浏览的专集超过90个。为了建设美国记忆, 美国国会图书馆先后组织了两期项目, 一个是"美国记忆试验计划"(1990-1994), 另一个是"美国数字图书馆计划"(1995-2000)。在国会图书馆2001 年预算中提到了第三期项目,"数字未来倡议" (2001-2004), 其最终目标是建立美国在线图书馆 (NationalOn�Line Library)。

美国记忆的搜索引擎

===搜索引擎的类别===

美国记忆使用了智能信息检索中心 ( Center for Intelligent Information Re�trieval, CIIR) 研制的一种索引和检索引擎 InQuery。

===搜索引擎的检索特点===

  1. 灵活。能对多种格式的文本进行索引, 例如HTML文本。在对某个文件内的记录建立索引时, 可以挂接用户自行开发的记录提取程序。
  2. 强大。提供了15种以上的查询操作, 其中既包括严格的逻辑操作、邻近操作, 还提供了基于概率模型的一些操作, 允许用户按照相关度来排列文献, 并且还允许用户给查询表达式中的检索词赋予不同的权重。
    对于文字类专集, 书目记录索引和全文索引是彼此独立的。考虑到美国记忆的核心用户是中小学教师和学生,美国记忆的搜索界面上只有一个输入的窗口, 这样用户无需知道系统的这些细节, 也就无需培训就能使用。实际的工作是 InQurey 在后台完成的。InQurey 会分别检索书目记录索引和全文索引, 如果查询表达式中有多个检索词, 这种搜索动作会进行很多次, 并将几次搜索的结果合并到一起。最后返回的命中文献可能是:
    (1.查询表达式中检索词构成的短语与文献中的一个短语完全一致, 该文献将排在命中文献列表的前面。
    (2.查询表达式中所有检索词均在文献中出现, 此时这几个检索词在文献中距离将决定该文献在命中列表的位置, 距离较近的排在前面。
    (3.如果上面两种情况都不存在, 那些仅包含查询表达式中部分检索词的文献也将作为命中文献返回。

===搜索引擎的系统结构===
美国记忆最初的原型系统基于苹果电脑公司Macintosh的HyperCard。图像在计算机屏幕上显示, 动态图像通过视盘在电视屏幕上显示[21]。这一结构随着国会图书馆把越来越多的专集放到万维网上而被逐步淘汰。但对数字馆藏复杂性的认识是个漫长的过程。在对一"件"数字馆藏的多样性有了较为明确认识之后, 美国数字图书馆计划选择了基于计算机科学技术报告 (Computer ScienceTechnicalReport, CS�TR) 结构的美国研究倡议公司 (Corporation forNationalResearch Initiatives, CNRI) 句柄 (Handle) 系统。这一结构又被称为Kahn/Wilensky 框架。CS�TR结构采用面向对象的分析方法, 较好地描述了数字图书馆内的基本元素---数字对象的内在结构和组织方法。句柄系统的核心是具有惟一性的资源标识, 又称句柄。传统图书馆经常把索取号作为惟一性标识, 每件馆藏都拥有一个这样的标识; 句柄的作用与索取号的作用类似, 但更为灵活和复杂, 这是由于同传统馆藏相比, 数字馆藏具有更大的随意性和复杂性。美国记忆系统结构示意图见图1。