麦子:不要把大数据作一个筐,什么都往里面装,在我看,上面说的流通数据收集之类,我们都是管理员做的,而国内这些劳力的体力活,我们基本都是学生做的。我自己从来不做收集和整理数据,我往往要做一个具体的决定时,才让一个管理员去用计算机按规定我的要求算我需要的东西。另外,我们的所有流通数据都最终用于资源的采购,而不是提高流通什么的。麦子:我不知道大家对这些大数据怎么看的,但我的理解是,如果数据之类的东西如果真有质量地在图书馆里做,大概需要有被噎死(贝叶斯)概率之类的理论。比如,用一个很小的数据,可以算出一些有用的数据预测。比如,用几天的入门数据和借出的书籍算出一年的流通量,需要那些资源,这是大数据在图书馆业务上的运用,而大数据的最大运用应该是在把现有的资料联系起来,做完全不同的资料。比如,把所有历史上的作者,他们的每天的行踪,和他们的作品,全部数据化,这样,你就可以去的在乾隆15年三月4日,某文人和某文人在扬州,他们可能有机会碰面,而其中有个文人写的作品中的一句其实是由于和他们的碰面有关的。这种东西,就有质量了,因为它为学术研究有贡献。麦子:贝叶斯概率是极有用的的东西,但理解的好的人不可能在图书馆工作,尽管这对图书馆是很有用的。星光:我天哪,这不就是用大数据实现蝴蝶效应和历史重现么?!麦子:有兴趣的可以看圕人堂周讯(总第56期 20150605) 愿景(VISION):圕结就是力量!文的么。麦子:@如图 我也只是在想这个问题,如何把一些跨学科的东西用于图书馆,动机是把简单数据分析和数据在计算机时代的复杂运用分别开来。弋痕夕:从麦子老师这总能开阔视野。生清:感谢麦子,很早就听人说贝叶斯,但将这一原理在图书馆说得如此通俗透彻的,你是我遇到的第一个。hanna:麦子老师说的就是沈志华的研究方法,他研究朝鲜战争,通过发电报的顺序判断出当时政治走向。
以下格式等价,请按需引用或修改后使用:
[1]圕人堂QQ群知识库.大数据与图书馆[EB/OL].(2015-06-05)[2025-04-11].http://tuan.pub/server/detail.php?id=1496.
[2]麦子,星光,弋痕夕,等.大数据与图书馆[DB/OL].圕人堂周讯,2015(56):24.
[3]麦子,星光,弋痕夕,等.大数据与图书馆[DB/OL].(2015-06-05)[2025-04-11].http://tuan.pub/server/detail.php?id=1496.