多媒体搜索引擎

来自《信息检索》
跳转至: 导航搜索


概述 [1]

  • 多媒体搜索引擎是指提供多媒体内容搜索的搜索引擎。图形、图像、视频、音频、动画、影视等多媒体信息资源在WWW上越来越丰富,用户对多媒体信息资源的检索需求也越来越多。
  • 多媒体搜索引擎所依赖的多媒体检索技术主要包括图形图像编码压缩技术、音频压缩技术、动画视频压缩技术、流式媒体技术、多媒体数据库技术等。

类型

基于文本描述的多媒体搜索引擎

  • 当前信息检索技术还是以文本信息检索为主,基于多媒体特种的检索技术没有取得根本性的突破,因而目前的多媒体搜索引擎主要是以基于文本描述的多媒体搜索引擎,这种搜索引擎主要是对含有多媒体信息的网站和网页进行分析,对多媒体信息的物理特征和内容特征进行著录和标引,把它们转换成文本信息或者添加文本说明,建立数据库,检索时主要在此数据库中进行文本匹配。可检索的内容主要有文件类型、标题、内容描述、人工标引的信息(如物体、背景、构成、颜色特征、分类以及文本描述)。

基内容特征的多媒体搜索引擎

  • 基于内容特征的多媒体搜索引擎是多媒体搜索引擎的发展趋势,目前这种搜索引擎还不多见。当前也有一些多媒体搜索引擎积极进行这方面的实践,初步展示出了这种多媒体检索技术的魅力。基内容特征的多媒体搜索引擎是直接对媒体内容特征和上下文语义环境进行的检索。基于这种方法的搜索引擎一般由两部分组成:数据库生成系统和查询子系统。具体而言,就是多媒体信息标引系统和检索系统。标引系统首先完成对多媒体的预处理和提取特征等,建立起多媒体信息数据库系统。这个系统包括信息库、特征库和知识库。信息库储存数字化的多媒体信息;特征库储存多媒体内容特征和客观特征;知识库储存专门和综合性知识,有利于查询优化和快速匹配。检索系统则先对用户输入的多媒体信息进行特征提取,然后在多媒体特征库中进行检索,将与用户要求最相似的信息输出。
  • 基于内容特征的多媒体搜索引擎和基于文本描述的搜索引擎的一个重要区别,就是以相似匹配来代替精确匹配,因为相同内容的多媒体信息的表现形式可能不同。用户在进行检索时,只需先将所需信息的大致特征描述出来,就可以找出与检索提问具有相近特征的多媒体信息,然后可以在给出的结果中作进一步的查询,直至获得符合要求的结果。
  • 基于内容特征的多媒体搜索引擎可以的内容主要有:图像的颜色、纹理、形状等;声音的音频、响度、频度、音色;影像的视频特征、运动特征等。

多媒体搜索引擎列表

基于文本描述

  • 专门的多媒体搜索引擎
  1. PlayAudioVideo:http://www.playaudiovideo.com/
  • 综合搜索引擎的多媒体搜索
  1. 百度:图片、视频、MP3
  2. 搜狗:音乐、图片、视频
  3. 有道:图片、音乐、视频
  4. 中搜:MP3、图片
  5. 爱问:音乐、图片
  6. 搜搜:图片、视频、音乐
  7. Google:图片、视频
  8. 必应:图片、视频
  9. Lycos:图片、视频
  10. Yahoo!图片搜索:http://image.cn.yahoo.com/ 全球20亿中文图片搜索
  11. Alta Vist

基于内容特征

  1. WebSEEK: http://www.ctr.columbia.edu/webseek/

参考文献

  1. 邓成剑.WWW多媒体搜索引擎研究评论[J].图书情报知识,2003(1)

参与本页讨论

用户留言:
目前暂无留言
新增留言 编辑留言