对数据开放的探讨

   圕人堂周讯(总第395期20211203),第10页,李爱玲 整理 王启云 助理   
学图-123:我觉得数据应该开放,特别是专业院系的师生,有了专业资料员的阅读推广服务,可以促进高校图书馆的利用率。
傲娇的*:@骑鹿踏雪数据库的开放,是需要数据商授权的,这个基本上不太可能达到公共数据的范畴,最多能开放题录和摘要。
骑鹿踏雪:@傲娇的*您的意思我明白,问题在于‘北某宝’它自身就不是一个私立企业,它的资金来源,人员都是国有经费。
学图-123:高校图书馆我个人觉得就应该开放,面向社会开放,才能全面提高国人素质。
图漾:涉及机密的数据另说,那样的数量极少。一般的科研数据哪有那么金贵?国家经费资助的难道不是公共数据?科研数据开放的阻力就在于这些小农意识的科研者身上。哪天基金委也像美国nsf等机构提出数据开放要求就好。全归过于科研SCN也是不公平的,还有一部分是科研美工,图都是ps的,公开数据不是要他的命吗。
傲娇的*:@图漾其实也要考虑,一些没有基金支持,自己收集整理的数据,这类数据他们是有绝对的话语权的,而且这类数据的占比也不小,这类数据是需要授权的。当然您说的有国家基金支持的数据,我也觉得应该无条件开放,毕竟经费是全民支持出来的。
学图-123:一些没有基金支持,自己收集整理的数据,这类数据他们是有绝对的话语权的,而且这类数据的占比也不小,这类数据是需要授权。这类数据一旦以文本形式发表,不就已经是公开数据了吗?打个比方哈,图谋老师在本群经常发的博文,那算不算公开数据呢?需不需要做脱敏处理再转发呢?没有正式出版物发表的话,有人直接搬运走算不算抄袭呢?
傲娇的*:并不是的,论文发表出来了,但是背后的数据确有另外的价值,有太多的论文基于数据,但是你却不知道数据的全貌,而数据公开后经过重复利用,可能会有新的用处。
骑鹿踏雪:最高法的文书库是公开的,但是各种下载量太大,而且还有用下载工具的,然后就非常的卡。
傲娇的*:@骑鹿踏雪虽然基础数据是公开的,但是公司进行整理运营,也是需要花费人力物力财力的,所以要求他们无条件公开是不太可能的,当然,就像图漾说的,你可以去公开的地方去下载,但是没有权利去要求公司完全公开。公司不是公益机构,他不可能白给谁干活,他们的盈利目的是必然的。
图漾:人家北某宝(当然还有其他类似数据库)可以一键检索出所有的法律要点,打通法条、案例、论文、专题文献、司法解释等,你用不也是图人家用起来方便吗。
傲娇的*:但是,我想说的是,收费的数据好,但是需要花钱。你要是不想花钱,也有免费的数据让你用,只是免费的质量稍差一些,需要你花更多的时间去整理和甄选。两条路都给你了,是你自己选哪条路的问题。
徐徐清风:这种研究比较纯学术和理论化。图书馆只需自问:凭什么要开放给别人?自己有什么权利开放?想开放,但上级不准,没有太多复杂因素和心理。现在有些高校图书馆的网站,很多栏目外界都访问不了,OPAC都不让直接查询。
傲娇的*:@徐徐清风这个问题其实我已经研究了很久。第一,开放给别人,属于互利互惠,你开放给别人,别人也会开放给你,同时,对于图书馆治理水平,减少重复建设,图书馆智慧生态的建立都有好处。第二,自己有产权的数据就可以开放,不涉及到个人隐私、知识产权、数据安全等敏感因素的数据,经过脱敏、脱密技术处理后就可以开放。第三,现在公共数据开放是大趋势,各省市的公共数据开放平台都已经建立起来了,所以,上级不准的时代,基本上已经过去了,现在更多考虑的应该是怎么开放。
诲人不倦:现在这些数据的采集和存储都是问题,谈不到开放。
傲娇的*:@诲人不倦对,这确实也是应该解决的问题,而且是很大的问题。
广东小*:连统计数据的标准化都还没有做到,数据就是开放出来用起来也非常别扭。
傲娇的*:嗯,现在是相关的政策、数据标准、规范和流程都是需要研究的内容。道路还很远呢。
诲人不倦:还是应该呼吁学会,建立数据采集,存储和开放的相关标准和规范,建立数据联盟中心,促进数据流动和增值。
图漾:@傲娇的*虽然各省都有数据开放平台了,但质量良莠不齐,做的好的还是那些发达地区,北上广深。我们省的就不咋的,为了完成任务干的,数据开放量少不说,数据格式居然有大量jpg和doc。
傲娇的*:@图漾您说的很对,这也是要必然经历的过程,理论一般都是先行于实践的,所以我们才先做理论研究的。要不然,这种状况会一直持续下去,或许慢慢就烂尾了。但是有理论者一直在研究和推动,慢慢的或许就被重视起来了。

以下格式等价,请按需引用或修改后使用:

[1]圕人堂QQ群知识库.对数据开放的探讨[EB/OL].(2021-12-03)[2024-07-07].http://tuan.pub/server/detail.php?id=9581.

[2]傲娇的*,学图-123,图漾,等.对数据开放的探讨[DB/OL].圕人堂周讯,2021(395):10.

[3]傲娇的*,学图-123,图漾,等.对数据开放的探讨[DB/OL].(2021-12-03)[2024-07-07].http://tuan.pub/server/detail.php?id=9581.