知识问答搜索引擎

来自《信息检索》
Wangjt讨论 | 贡献2010年2月10日 (三) 23:31的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索


知识问答搜索引擎概述

概念

  • 知识问答搜索引擎(Answers Searching),是基于搜索的互动式问答平台,也称为问答式检索系统或问答系统。如同web2.0环境下的BBS,用户通过开放注册提问和回答问题,随着时间的推移,这些问题形成大量的知识库,通过搜索实习知识的分享。知识问答搜索引擎支持用户通过以自然语言形式提问(如:什么是3G)。与基于网页对搜索引擎不同的是,知识问答搜索引擎给出的是问题的答案而不是链接,而且其本身也是一种服务。

历史

  • 最早的知识问答搜索引是韩国的搜索引擎DBDlC于2000年10月建立的知识问答平台,被称为该模式的始祖。该平台将问答平台产生的答案进一步沉淀为知识,并作为搜索结果提供给搜索引擎使用者[1]
  • 2004年7月,国内有影响的第一个知识问答搜索引擎爱问知识人正式上线时命名为“请问我”,2005年5月30日正式改名爱问知识人。
  • 2005年6月百度知道诞生(测试版),11月1日正式上线。成为国内又一个知识问答搜索引擎。

特点

  • 知识问答搜索引擎是搜索引擎自身为适应网络信息环境和用户需求发展到web2.0时代而提供的服务,在web2.0的新环境中,用户越来越喜欢分享、同创和参与的网络文化。知识问答搜索引擎具备如下基本特征:
    1. 是基于开放的、借助网络人力资源的、有悬赏机制(荣誉积分)的互动式问答平台。知识问答搜索引擎是充分利用网络人力资源来解决问题的成功体现,在互联网上每个人都可能是某一个方面的“专家”,而由这些“专家”来解答其擅长的问题,显然是再适合不过的。
    2. 和搜索引擎紧密结台。严格来说,知识问答搜索引擎不是真正的搜索引擎,值所以被称为搜索引擎,主要是由于这些系统一般基于母体搜索引擎强大的用户群从而得到很好的发展,问答知识作为web页面内容被众多搜索引擎大量索引,并被用户利用。
    3. 强调对知识的沉淀和分享。用户通过开放注册提问和回答问题,随着时间的推移,这些问题形成大量的知识库,通过搜索实习知识的分享。

原理[2]

  • 图1 知识问答搜索引擎原理
    典型的知识问答搜索引擎原理通常由提问处理模块、检索模块和答案抽取模块三部分组成,如图1所示。其中,提问处理模块负责对用户的提问进行处理;生成查询关键词(提问关键词,扩展关键词,...);确定提问答案类型以及提问的句法、语义表示等等。检索模块根据提问处理模块生成的查询关键词,使用传统检索方式,检索出和提问相关的信息。返回的信息可以是段落、也可以是句群或者句子。答案抽取模块则从检索模块检索出的相关段落、或句群、或句子中抽取出和提问答案类型一致的实体,根据某种原则对候选答案进行打分,把概率最大的候选答案返回给用户。

对搜索引擎的作用[1]

  1. 对信息源进行重构,从而在一定程度上解决搜索引擎对自然语言解析不够准确的问题。
  2. 弥补搜索引擎搜索结果的直接性和针对性相对不高的缺陷,降低获得信息的成本。
  3. 知识问答平台本身的搜索服务,可以提供高质量信息满足体验,并从整体上提高搜索引擎的信息服务质量。
  4. 知识问答平台可以有效地将存在于人脑中的隐性知识转化为显性知识。

其它知识搜索服务

利用技巧

问题搜索

  1. 不一定一开始就要到某个问答搜索引擎中去搜索。很多网页搜索引擎本身就会搜索不同来源的知识问答搜索引擎中的内容,而且用户也可以直接用“什么是××”等直接在网页搜索引擎中搜索,往往能得到不同知识问答搜索引擎中的内容。
  2. 不要只依赖一个问答搜索引擎。可以到多个问答搜索引擎中搜索。

提问

  1. 不是所有问题都可以通过知识问答搜索引擎来得到解决的。具有大量网民基础的内容是比较容易得到满意的解答的,比如计算机知识、网络、生活、健康和“什么是”、“为什么”等方面的内容是比较容易得到网友的积极回答的。
  2. 不要对知识问答搜索引擎的回答期待过高。“总有一个人知道你问题的答案”这是百度知道的口号,知识问答搜索引擎的确也解决了大量的问题,虽然如此也有大量的问题无人回答,特别是对一个新的问题,你是否有足够的时间去等待。总之,不要对知识问答搜索引擎的回答期待过高,仅仅当作解决问题的一个途径。
  3. 不要过分信任问题的答案。作为一个虚拟的、开放性的环境中,很多人基于自己的知识和经验来回答问题,的确对解决问题很有用,但必须记住,没有人会对其回答的问题负责。从实际情况看看,问题的回答质量也不总是让人满意,知识问答搜索引擎中搜索到的答案可做参考,问题的真实性和可用性需要自己判断。
  4. 给出较高的悬赏分能使你的问题得到关注和更容易被解决。
  5. 可以将你的问题同时发布到多个问答搜索引擎中去解决。这种方式有利也有弊,有利的是可以多到几个地方碰碰运气,有弊的是,你并不可能在每个系统中都帐号(注册也挺麻烦),而且你的悬赏分当然也不会高(除非你积极参与了系统中的回答问题)。

解答问题

  1. 参与!参与的确很重要,你不仅仅在贡献知识、帮助别人,在你组织知识和奉献经验的时候,你也在提高自己。
  2. 积分!积分对你也很重要,不仅仅是荣誉,这些积分对你提问并得到优先回答当然有用。你的问题给出的积分越高排名就越靠前,当然被关注和被解答的几率也越高。
  3. 转贴!转贴一些知识内容对解决问题往往也很有帮助。

知识问答搜索引擎列表

中文

  1. 百度知道:http://zhidao.baidu.com/
  2. [新浪]爱问知识人:http://iask.sina.com.cn/
  3. 雅虎知识堂:http://ks.cn.yahoo.com/
  4. 天涯问答:http://wenda.tianya.cn/
  5. [腾讯]搜搜问问:http://wenwen.soso.com/
  6. 搜狗问答:http://wenda.sogou.com/
  7. 奇虎经验搜索:http://jingyan.qihoo.com/

英文

  1. Allexperts:http://www.allexperts.com/
  2. Answers:http://www.answers.com/
  3. Ask:http://www.ask.com/
  4. Experts Exchange:http://www.experts-exchange.com/
  5. Google Answers:http://answers.google.com/answers/
  6. Information Please:http://www.infoplease.com/
  7. Yahoo! Answers:http://answers.yahoo.com/

朝鲜文

  1. Dreamwiz:http://www.dreamwiz.com/
  2. Naver:http://www.naver.com/

日文

  1. Goo:http://oshiete.goo.ne.jp/
  2. Hangame:http://plus.hangame.co.jp/
  3. Hatena:http://www.hatena.ne.jp/
  4. Yahoo!知恵袋:http://chiebukuro.yahoo.co.jp/


参考文献

  1. 1.0 1.1 田晓萌.基于搜索引擎的知识问答平台研究[J].数字图书馆论坛,2006(11):12-18,39
  2. 吴友政等.问答式检索技术及评测研究综述[J].中文信息学报,2005(3)

参与本页讨论

用户留言:
目前暂无留言
新增留言 编辑留言