数字资源使用统计

   圕人堂周讯(总第117期20160805),第23页,生清整理王启云助理   
小肥羊:下载量不一定是可观的。
gaozy:看情况。有的是精确的。
小肥羊:已经有多项研究证实了这个问题。访问量是资源商提供的。
广州书童:你说太对了,操控在数据商手里的神仙数。
印度阿三:我们的外文下载量少得可怜,不过我们是公图。
gaozy:这基本是共性。有的数据库,用户名和访问地址双重印证,基本精确的。
小肥羊:为了资源的续购,有夸大使用量的倾向。
gaozy:除非刻意造假,基本上都是可以统计。知网后台精确到时间,文章签名信息,下载时间,下载地址等。
高高:我们正准备验证几个大库的数据,个人认为水分很大,有的可以一个月800 多万,下个月20 几万。
gaozy:万方和维普的造假就比较明显了,但他们后台数据都是清楚明白的。
小肥羊:还有就是概念界定的问题。有时候我下载10 次才成功,系统计数是我下载了十篇而不是一篇。
广州书童:有些还是点击量。
高高:后台查不出来的,要关闭包库和镜像后,从IP 登陆进去测试。
gaozy:这些基本上最清楚的还是公司。他们的设置,一些统计算法等,很重要,数据差别很大。
cpulib*:下载量不好说比如我们做原文传递,一天下载几百篇文献呢,大多服务非本校老师。
gaozy:厉害。
小肥羊:还有些数据库访问量是用多少kb 来计算的。所以在填报开calis 的那个数据的时候,我们非常头痛。
扣肉:我就不明白,这些统计数字,直接跟数据商要不是更方便么。
gaozy:这些情况,都是你知我知。也不是机密,大家不要觉得这里有数据库商就不好说。我甚至直接点名三大中文库里的两个。
扣肉:数据商的统计真实性我不做评论,但是这个是合理正确的统计数据来源,如果觉得他提供的统计数字不对,那就应该要求数据商公布统计方法。
gaozy:我是这么认为的:统计确实必须,但真实与否,并不是特别重要,有的时候,需要我们连手起来,数据做得好看,也能争取支持,是多赢的。因为任何数据库,都会有用户。具体的情况,负责的业务馆员基本都心里有数。
扣肉:所以我会要求我们购买的一个视频数据库提供商,每月提供访问记录。因为我一向认为,这个库的内容,那么多通识内容,也未必是独家的,我们不应该在这个上面花那么多钱,而且这个数据库的分发模式本身就太落后了。
gaozy:说句到底的话:一个本科高校,能因为使用量低,而砍掉一些数据库吗?数据库多,本身也是保障能力的很有说服力的指标。砍掉的库,与其说是使用量,不如说是经费的因素。
扣肉:我们就没有购买万方的数据。
广州书童: 报高也存在各取所需的因素在。
gaozy:对,很现实。
闽师*源:数字资源的使用量应该要自己统计,我们引入第三方采集监测系统,不是很相信数据库商的后台数据,这是我们数字资源分析系统后台的,掌握自己读者的使用行为。
星光:和你们图书馆编目数据不改清楚明晰一个道理!为什么你们馆数据编目有水分。我也可以质问:为什么你们图书馆编目数据混乱不堪。
扣肉:我们编目数据不清,是历史问题,大家都是糊里糊涂的。
星光:图书馆可以自己做数据统计啊,为什么依赖数据商。图书馆不掌握使用数据,有点儿自打脸。
星光:那你们图书馆为什么自己不统计数据。
扣肉:因为实际上没法统计,而且不应该我们统计。
gaozy:这方面相对复杂。即便使用第三方,也很难精确。
扣肉:你不能因为不信任知网的数字,就自己弄。
gaozy:扣肉的问题主要是没有给负责编目数据的大妈几个耳光。
扣肉:目前的主要问题是,编目部主任的心思不在业务上。
星光:你们编目造假和数据商造假数据是一回事。
扣肉:我们数据不是造假,是混乱。领导混乱,底下的人糊涂,真不是造假。有问题,我都是反馈给编目部主任。
星光:所以数据商那边也是混乱状态呀。
扣肉:什么事情都系统管理员自己干,那就乱套了。
星光:这是正常现象。
扣肉:数据商的统计不是混乱,是因为他们的统计手段落后。
电子资源的统计,是最简单的。
星光:什么事情都数据商管也不对啊。
扣肉:实际上来讲,我到知网下载了几篇论文,这个事情,知网是有记录的。因为是从它的服务器上下载。
星光:既然简单,为啥图书馆干不了。
扣肉:因为我不知道我的读者去知网的服务器上干了啥,况且读者也可以自己在百度中搜索知网,直接上。
星光:你这图书馆后台管理系统不行。
扣肉:知网是根据IP 范围控制的。
星光:你是系统管理员。
扣肉:我图书馆只要保证本校的学生都能上知网就行了。
星光:百度网页版不计入数据点击量。
扣肉:我没法监控每一个读者,具体到知网的论文还是期刊下载了什么东西,技术上实现不了的。
星光:图书馆网页点击量都不行啊?从图书馆IP 地址数据库进入。
扣肉:这个数据,只能说明从我图书馆的网站链接到知网,点击数是多少。因为实际上读者是可以自己把知网加入收藏夹,直接进的。干嘛要必须通过图书馆的网站链接。对于知网来说,统计数字最关键的是,读者从哪个库里下载了多少篇什么内容的论文。
扣肉:这个才是有用的统计数字。
图谋:据个人了解,中国知网的数字资源使用统计模块(服务),在中文数据库中是做得最好的。(外文数据库中,ScienceDirect 数据库做得最好)。
蚯蚓:貌似这个模块的部署需要网络部门的支持。
gaozy:外文这一块,似乎acs 做的也不错。爱思唯尔这个,我没看过后台?
扣肉:你知道我的手机同时看直播看网络么?这是一样的道理。你监控读者的电脑流量,可以在网络中心加装流量分析系统,这不是图书馆该干的事。
星光:你连图书馆校园IP 地址数据库都控制不了,太无能为力了。
扣肉:不是控制,而是你监控别人的电脑流量,要不要事先征得别人的同意。没有授权,会不会是侵犯别人的隐私。上网行为控制,对于大学生这个成人群体来讲,法理上有瑕疵。如果你可以监控,他去知网上干什么,那么是不是也可以监控他到别的网站上去干什么。公安部门只会对犯罪嫌疑人采取监控措施,而且并不是什么人都可以随便监控的。作为从业IT 二十年的人,我知道技术上没有什么不能做的,但是要讲法理。如果人人都是自己觉得什么事情可以做,就去做,那中国的法制化就永远不能推进。
gaozy:一言以蔽之,非不能,乃不为也。
boson:就拿qq 来说,实际上就算匿名也能追查到发言者,为毛还要实名登记。
gaozy:目前的网络环境,对一般人而言,上网就是类似于公众场所不穿衣服的皇帝。当我们耀武扬威,胡乱点击,其实,有人正在看着一举一动,并且记录在案。这很恐怖,不能多想。
星光:实名是为了给广大人民设定一个颈箍咒,并且让你知道自己有颈箍咒。
扣肉:我不明白,你为什么不相信知网的统计数字。你连钱都能给它,可见还是相信的。
星光:刚才说了数据商数据造假。
扣肉:我没有说过啊。我说的是,对于数据商统计数字的真实性我不做评论。因为我没有什么可评论的。况且绝大多数的数据商也不是根据统计数字收费的。
扣肉:对于知网来说,你今年只有十个读者下载,明年有十万个读者下载,知网也不会以一万倍的差价收费。如果你对知网的统计数字有质疑,可以通过合理的渠道向知网反应。可能就是统计方法上有问题,或者技术手段有瑕疵。我倾向于认为,数据商是不屑于在统计数字上做手脚的。因为他们不是按照数字收费的。
gaozy:相当有水平,再扯扯数据库定价,那搞不灵清了。
嘉懿:其实,每个行动者都知道在造假而他们又都在视而不见/故意掩盖/相互帮衬吹捧,以至于形成了关于科研支持的神话,这本身就是很有趣的问题。不同的行为逻辑,会聚在数据库这个节点上。
gaozy:科研支持是客观的。
扣肉:科研造假的问题,我不做评论,很多也是以前僵化的管理制度造成的。现在管理制度放开了,大家就不用费心去钻制度空子了。

以下格式等价,请按需引用或修改后使用:

[1]圕人堂QQ群知识库.数字资源使用统计[EB/OL].(2016-08-05)[2024-07-07].http://tuan.pub/server/detail.php?id=2168.

[2]扣肉,gaozy,星光,等.数字资源使用统计[DB/OL].圕人堂周讯,2016(117):23.

[3]扣肉,gaozy,星光,等.数字资源使用统计[DB/OL].(2016-08-05)[2024-07-07].http://tuan.pub/server/detail.php?id=2168.