数字资源使用统计[圕]

数字资源使用统计

← 圕人堂周讯（总第117期20160805），第23页，生清整理王启云助理 →

小肥羊：下载量不一定是可观的。
gaozy：看情况。有的是精确的。
小肥羊：已经有多项研究证实了这个问题。访问量是资源商提供的。
广州书童：你说太对了，操控在数据商手里的神仙数。
印度阿三：我们的外文下载量少得可怜，不过我们是公图。
gaozy：这基本是共性。有的数据库，用户名和访问地址双重印证，基本精确的。
小肥羊：为了资源的续购，有夸大使用量的倾向。
gaozy：除非刻意造假，基本上都是可以统计。知网后台精确到时间，文章签名信息，下载时间，下载地址等。
高高：我们正准备验证几个大库的数据，个人认为水分很大，有的可以一个月800 多万，下个月20 几万。
gaozy：万方和维普的造假就比较明显了，但他们后台数据都是清楚明白的。
小肥羊：还有就是概念界定的问题。有时候我下载10 次才成功，系统计数是我下载了十篇而不是一篇。
广州书童：有些还是点击量。
高高：后台查不出来的，要关闭包库和镜像后，从IP 登陆进去测试。
gaozy：这些基本上最清楚的还是公司。他们的设置，一些统计算法等，很重要，数据差别很大。
cpulib*：下载量不好说比如我们做原文传递，一天下载几百篇文献呢，大多服务非本校老师。
gaozy：厉害。
小肥羊：还有些数据库访问量是用多少kb 来计算的。所以在填报开calis 的那个数据的时候，我们非常头痛。
扣肉：我就不明白，这些统计数字，直接跟数据商要不是更方便么。
gaozy：这些情况，都是你知我知。也不是机密，大家不要觉得这里有数据库商就不好说。我甚至直接点名三大中文库里的两个。
扣肉：数据商的统计真实性我不做评论，但是这个是合理正确的统计数据来源，如果觉得他提供的统计数字不对，那就应该要求数据商公布统计方法。
gaozy：我是这么认为的：统计确实必须，但真实与否，并不是特别重要，有的时候，需要我们连手起来，数据做得好看，也能争取支持，是多赢的。因为任何数据库，都会有用户。具体的情况，负责的业务馆员基本都心里有数。
扣肉：所以我会要求我们购买的一个视频数据库提供商，每月提供访问记录。因为我一向认为，这个库的内容，那么多通识内容，也未必是独家的，我们不应该在这个上面花那么多钱，而且这个数据库的分发模式本身就太落后了。
gaozy：说句到底的话：一个本科高校，能因为使用量低，而砍掉一些数据库吗？数据库多，本身也是保障能力的很有说服力的指标。砍掉的库，与其说是使用量，不如说是经费的因素。
扣肉：我们就没有购买万方的数据。
广州书童：报高也存在各取所需的因素在。
gaozy：对，很现实。
闽师*源：数字资源的使用量应该要自己统计，我们引入第三方采集监测系统，不是很相信数据库商的后台数据，这是我们数字资源分析系统后台的，掌握自己读者的使用行为。
星光：和你们图书馆编目数据不改清楚明晰一个道理！为什么你们馆数据编目有水分。我也可以质问：为什么你们图书馆编目数据混乱不堪。
扣肉：我们编目数据不清，是历史问题，大家都是糊里糊涂的。
星光：图书馆可以自己做数据统计啊，为什么依赖数据商。图书馆不掌握使用数据，有点儿自打脸。
星光：那你们图书馆为什么自己不统计数据。
扣肉：因为实际上没法统计，而且不应该我们统计。
gaozy：这方面相对复杂。即便使用第三方，也很难精确。
扣肉：你不能因为不信任知网的数字，就自己弄。
gaozy：扣肉的问题主要是没有给负责编目数据的大妈几个耳光。
扣肉：目前的主要问题是，编目部主任的心思不在业务上。
星光：你们编目造假和数据商造假数据是一回事。
扣肉：我们数据不是造假，是混乱。领导混乱，底下的人糊涂，真不是造假。有问题，我都是反馈给编目部主任。
星光：所以数据商那边也是混乱状态呀。
扣肉：什么事情都系统管理员自己干，那就乱套了。
星光：这是正常现象。
扣肉：数据商的统计不是混乱，是因为他们的统计手段落后。
电子资源的统计，是最简单的。
星光：什么事情都数据商管也不对啊。
扣肉：实际上来讲，我到知网下载了几篇论文，这个事情，知网是有记录的。因为是从它的服务器上下载。
星光：既然简单，为啥图书馆干不了。
扣肉：因为我不知道我的读者去知网的服务器上干了啥，况且读者也可以自己在百度中搜索知网，直接上。
星光：你这图书馆后台管理系统不行。
扣肉：知网是根据IP 范围控制的。
星光：你是系统管理员。
扣肉：我图书馆只要保证本校的学生都能上知网就行了。
星光：百度网页版不计入数据点击量。
扣肉：我没法监控每一个读者，具体到知网的论文还是期刊下载了什么东西，技术上实现不了的。
星光：图书馆网页点击量都不行啊？从图书馆IP 地址数据库进入。
扣肉：这个数据，只能说明从我图书馆的网站链接到知网，点击数是多少。因为实际上读者是可以自己把知网加入收藏夹，直接进的。干嘛要必须通过图书馆的网站链接。对于知网来说，统计数字最关键的是，读者从哪个库里下载了多少篇什么内容的论文。
扣肉：这个才是有用的统计数字。
图谋：据个人了解，中国知网的数字资源使用统计模块（服务），在中文数据库中是做得最好的。（外文数据库中，ScienceDirect 数据库做得最好）。
蚯蚓：貌似这个模块的部署需要网络部门的支持。
gaozy：外文这一块，似乎acs 做的也不错。爱思唯尔这个，我没看过后台？
扣肉：你知道我的手机同时看直播看网络么？这是一样的道理。你监控读者的电脑流量，可以在网络中心加装流量分析系统，这不是图书馆该干的事。
星光：你连图书馆校园IP 地址数据库都控制不了，太无能为力了。
扣肉：不是控制，而是你监控别人的电脑流量，要不要事先征得别人的同意。没有授权，会不会是侵犯别人的隐私。上网行为控制，对于大学生这个成人群体来讲，法理上有瑕疵。如果你可以监控，他去知网上干什么，那么是不是也可以监控他到别的网站上去干什么。公安部门只会对犯罪嫌疑人采取监控措施，而且并不是什么人都可以随便监控的。作为从业IT 二十年的人，我知道技术上没有什么不能做的，但是要讲法理。如果人人都是自己觉得什么事情可以做，就去做，那中国的法制化就永远不能推进。
gaozy：一言以蔽之，非不能，乃不为也。
boson：就拿qq 来说，实际上就算匿名也能追查到发言者，为毛还要实名登记。
gaozy：目前的网络环境，对一般人而言，上网就是类似于公众场所不穿衣服的皇帝。当我们耀武扬威，胡乱点击，其实，有人正在看着一举一动，并且记录在案。这很恐怖，不能多想。
星光：实名是为了给广大人民设定一个颈箍咒，并且让你知道自己有颈箍咒。
扣肉：我不明白，你为什么不相信知网的统计数字。你连钱都能给它，可见还是相信的。
星光：刚才说了数据商数据造假。
扣肉：我没有说过啊。我说的是，对于数据商统计数字的真实性我不做评论。因为我没有什么可评论的。况且绝大多数的数据商也不是根据统计数字收费的。
扣肉：对于知网来说，你今年只有十个读者下载，明年有十万个读者下载，知网也不会以一万倍的差价收费。如果你对知网的统计数字有质疑，可以通过合理的渠道向知网反应。可能就是统计方法上有问题，或者技术手段有瑕疵。我倾向于认为，数据商是不屑于在统计数字上做手脚的。因为他们不是按照数字收费的。
gaozy：相当有水平，再扯扯数据库定价，那搞不灵清了。
嘉懿：其实，每个行动者都知道在造假而他们又都在视而不见/故意掩盖/相互帮衬吹捧，以至于形成了关于科研支持的神话，这本身就是很有趣的问题。不同的行为逻辑，会聚在数据库这个节点上。
gaozy：科研支持是客观的。
扣肉：科研造假的问题，我不做评论，很多也是以前僵化的管理制度造成的。现在管理制度放开了，大家就不用费心去钻制度空子了。

以下格式等价，请按需引用或修改后使用：

[1]圕人堂QQ群知识库.数字资源使用统计[EB/OL].(2016-08-05)[2026-07-11].http://tuan.pub/server/detail.php?id=2168.

[2]扣肉，gaozy，星光，等.数字资源使用统计[DB/OL].圕人堂周讯,2016(117):23.

[3]扣肉，gaozy，星光，等.数字资源使用统计[DB/OL].(2016-08-05)[2026-07-11].http://tuan.pub/server/detail.php?id=2168.

圕人堂 QQ 群知识库

数字资源使用统计