开放目录
来自《信息检索》
开放目录概述
- 开放目录(ODP)是基于志愿编辑人员来审核挑选网站,并依照网站的性质及内容来分门别类地构建庞大的网络信息资源导引库,其描述对象以网站为主,为用户提供基于分类和主题的信息资源浏览和检索。每条目录负责人的工作包括:简单描述网站并提交数据、解决死链接、剔除低劣信息、保持内容质量、搜寻并加入新的主题等。最早的基于开放目录的网站是1998年6月5日创建的gnuhoo,它是一个完全开放的、网民共建、网络共享的分类搜索系统,被网景收购后,被正式命名为ODP(Open Directory Project),网站也易名为http://dmoz.org 。ODP“是本着建立一个无偏见的、为大众服务的、阐述各种不同观点的以及全面描述人类智慧为宗旨的,并由来自不同国家、不同文化背景、兴趣爱好的编辑共同维护网站目录的社区组成”的。ODP的数据目前被Google等许多大型搜索引擎所引用,ODP也成了开放目录的代名词(在国外,ODP同时以DMOZ而知名)。
- 在国内,2000年9月14 日,网易公司率先推出了http://odp.163.com(已经不存在),作为开放式目录的示范和“中国最大的开放式引擎”,得到众多网民的瞩目和热情参与[1]。http://odp.nit.net.cn 是当前基于web2.0创建的唯一一个以网络学术信息资源为对象的开放目录。在泛在网络信息环境下ODP网站必将迎来新的春天。
开放目录的特点[2]
公平编辑原则与公益性
- 目前,没有一家搜索引擎承诺不会因为商业目的改变搜索结果和网站收录规则,相对于这些充斥着竞价排名、商业广告的搜索引擎,公平原则与公益性是开放目录生存和发展的根基,也是吸引大量志愿者参与的重要原因。如Domz “是一个本着建立一个无偏见的、为大众服务的、阐述各种不同观点的,以及全面描述人类智慧为宗旨的,并由来自不同国家、不同文化背景、不同兴趣爱好的编辑共同维护的社区所组成”。为此,Domz对商业网站的收录非常谨慎,对一些网站不负责任地提交或登录系统、歧视或干预竞争者的行为进行了限制并给出相应的处罚条例。这些管理规范保证了Domz的正常运转,维护了其信誉,激发了志愿者的荣誉感。在体现公益性方面,Domz除为大众提供全球视野的导航服务外,还将其元数据开放利用,打包供人下载。
数据利用的开放性
- 开放目录的公平编辑原则与公益性,以及由众智完成的网络信息资源开发模式,决定了其数据必然是开放利用的。任何人,只要他们注意站点政策和接受许可协议,就可以免费下载和使用开放目录的数据。开放目录网站提供有专门的数据开放利用页面,这是开放目录与搜索引擎及学科信息门户的不同之处。开放目录数据利用的开放性提升了开放目录的社会效益,增强了志愿者的凝聚力。
信息资源的自组织性
- 开放目录的信息资源自组织性体现在信息资源建设的众智(Wisdom of Crowds)特性和目录体系自成长性上。web2.0体现了开发、参与、分享和协作精神,在web2.0概念提出之前,开放目录已在实践web2.0的精神,利用众智构建了庞大的信息资源目录,所有网站的发现、添加、维护都由网民来完成。开放目录的网站构建者仅仅提供一个平台,网民出于自己的兴趣、爱好和公益精神,基于开放目录平台志愿来组织网络信息资源。作为开放目录信息资源组织的核心——目录体系,是当前网络分类工具中唯一向用户开放的分类系统。目录体系中的类目是由具有某一方面专长的目录编辑员(网民)来进行维护,为了能够及时和有效地反映网络信息资源的实际发展情况,不同目录等级的目录编辑员可删减和扩展类目。在网站的长期运行中,基于众多目录编辑员的“添砖加瓦”,目录体系逐步形成和得到发展完善,最终形成一个有效的、庞大的、动态变化的自成长性的目录体系。
开放目录网站
- 学术信息资源开放目录
- DMOZ:http://www.dmoz.org
- ChefMoz:http://chefmoz.org/ 主要提供酒店黄页信息的收集整理与评论。
- Musicmoz:http://musicmoz.org/ 专门针对互联网上的音乐信息资源进行组织。
参考文献