统计数字的可信度

   圕人堂周讯(总第98期20160325),第11页,海边整理王启云助理   
麦子:[上面]其中的学校介绍一段明显是国内留学文宣里抄来的:‘以占地规模计算,天普大学在全美是面积第 27大的高等教育学府’。我查了网上,学校面积只有 115公顷,绝无可能排到 27, 估计227都难排上,但我不知道这圕人堂周讯(总第 98 期 20160325)个面积是怎么算的。美国大学的面积十大,第一名 27000公顷,第十名是 5300,我们学校 2000,但从来不提面积,因为 2000没什么可说的。天普只有 115公顷,可以说是微型的。我觉得哥伦比亚已经小得可怜,但也有 299。
Nalsi:美国排大学谁看占地面积啊。不过是啊,Temple 感觉好小,应该还没有Penn大呢吧。大城市的大学面积都不可能太大就是。
麦子:就是其实不查都可以猜 出。国内很多东西都是乱写一气忽悠人的。国内喜欢比面积,因为其他的难定性。penn是 302,比 Columbia 大3,所以基本一样大。
印度阿三:这个是翻译过来的吗。
麦子:是拼凑的。
芷芸:麦子老师说的是。国内有些学者治学实在不严谨,只会生搬硬套。缺乏事实根据,更有甚者,制造假象。如国内有些图书馆为了评估达标,统计借阅量,规定每位在班工作的准备一定数量的图书每天重复刷几遍,刷来刷去就刷那些书。还有统计到馆率以进出馆计数,不是以刷一卡通为依据等等,那些伪数据,非事实数据。
麦子:的确,所以,和弄虚作假比,不严谨可能也就被人忽略了。但明眼人一看,和弄虚作假一样,你还不如避开这个算法呢。
印度阿三:很多数据大家心知肚明,只是笑而不 语。
Nalsi:这件事情说起来还挺有意思的,因为 Temple的官方网站上说的它们是第 27大的学校(https://temple.edu/about/temple-now/urban-environment), 不过这看起来应该指的是招生人数,虽然也肯定不是最近的招生人数。
麦子:可能是 2014年,37788 学生人头数,包括半时。
麦子:查了 arl的年度工资调查报告。美国没有评估,但这种自己送交的统计数据实在说明太多的问题。这是 Arl 每年众多调研报告中的一个,只包括大约不到 130个协会内的图书馆的工资统计报告,有 179页。[包括]历年工资上升趋势,各校有多少馆员,平均工资,中位数,起薪,平均工作年,这很有意思的。各馆的中位数工资,加拿大的都排在前面,而最后的几个的比我们管理员的工资差不多,所以差距很大。接下来是大量的有关族裔,性别,资历的不同在工资上的表现,179 页啊。说了这些,无非想拿评估和这种统计调查相比,另外就是想说美国在统计上的仔细程度,毕竟工资在图书馆的众多数据里不是太重要的一个东西,而且不能表面一个图书馆的好坏,但就连这样的数字报告都有这样的细节,其他的我们可想而知了。大家把自己的家底掏出来,放在桌面上,到底如何,一目了然,问题当然是这种自我提圕人堂周讯(总第 98 期 20160325)供数据的真实性,否则就没有意义了。
图谋:我们的环境要做到这一点非常困难。其实也是非常羡慕的。历史学家黄仁宇总结为美国的‘数目字管理’,其实广泛赞赏。多少年来,积极学习与模仿,但似乎至今未能见到显著进步。统计工作可谓天天做,月月做,但很多统计数字,缺乏指导意义或参考价值。一些相对权威的统计结果,同样严重缺乏信度和效度。
惠*澈:用数字说话,但是数字也有诈。
麦子:就是这样,但美国这种事弄不好,坐牢可能都有,所 以,很少谁会惹这个麻烦。
芷芸:目前热衷大数据研究,用数据说话,但那些假数据的研究给决策者决策有误导倾向,没有参考价值可言,受害的是大众。
麦子:刚查了一下,arl 的统计是从 1963年就有了每年的统计出版物,但数字收集是从 1908年开始的,1963 年汇总了1908-1962。
惠*澈:国内总是羡慕国外而学习不到位,原因在于自欺欺人。有个同事,数学背景,做研究总是用数学模型分析预测,可我知道她的基础数据是经过调整的以利于研究的,这样的预测就是无效的,可是别人应该是佩服她的,从此,[我]对数据很警惕和质疑。
图谋:学术文字(包括论文、图书等),写的人越来越多,读的人越来越少,用的人更是越来越稀缺。

  1. 由《对修订<普通高等学校图书馆规程>的若干建议》一文的引发的对高等学校图书馆领导、管理制度以及外包业务等讨论
  2. 图书馆系统获取数据库平台的元数据,是不是要取得数据库商授权?
  3. 数据库统计数字的界定
  4. 关于百度百科、维基百科作为信息源的讨论,百科工具和图书馆的合作,以及关于信息民主和自由的讨论
  5. 《国内科技情报学会调查问卷》《数字资源共享平台信息服务能力指标调查问卷》
  6. 关于利用图书馆用户借阅系统数据实现社交功能的方式和可行性的讨论
  7. 《所有权的终结:数字时代的财产保护》与电子书的发展精妙比喻
  8. 会议EI凌小红:基于VR数字媒体的动画多媒体交互展示的收录数据
  9. 图书馆统计数据的获取途径
  10. 用户对读秀数据库的使用意见以及关于图书馆服务质量定义的讨论
  11. 机构知识库、数字资产管理系统及知识产权保护
  12. 有没有数据库能据书名关键字返回图书的isbn等详情信息
  13. 《普通高等学校基本办学条件指标(修订征求意见稿)》中数字资源折合量的计算方法
  14. 高校基本办学条件与文献资源建设之本科教学评估中的图书指标要求
  15. 什么途径能比较全面完整地掌握整个出版市场的图书发行情况?
  16. 高校师生信息素养的普及培训和学习,人的检索速度和知识储存量真闹不
  17. 如何统计馆藏数字资源?
  18. 高等教育质量监测国家数据平台数据表格指标解释中的图书包含期刊吗
  19. 重磅:《提升全民数字素养与技能行动纲要》发布,值得我们高度关注
  20. 电子资源数据库停止订阅的相应制度和规则
以下格式等价,请按需引用或修改后使用:

[1]圕人堂QQ群知识库.统计数字的可信度[EB/OL].(2016-03-25)[2024-07-07].http://tuan.pub/server/detail.php?id=6262.

[2]麦子,Nalsi,印度阿三,等.统计数字的可信度[DB/OL].圕人堂周讯,2016(98):11.

[3]麦子,Nalsi,印度阿三,等.统计数字的可信度[DB/OL].(2016-03-25)[2024-07-07].http://tuan.pub/server/detail.php?id=6262.