大数据(讨论之二)

   圕人堂周讯(总第129期20161028),第14页,海边整理王启云助理   
hanna:http://www.yeesight.com/大数据?
-13911*:他不经意间用了个恰当的数学模型,恰好又捕捉到了有用的数据。
一直很*:林*从井冈山开始,就一直带着一个小本本,用来记录每次战斗的战绩与得失,好多同事批评他好大喜功,只关注结果。那是大数据吗?只能证明林*关注细节,是一个有心人矣。如果林*案例都能叫大数据,那不是更好吗?把大数据拉下神坛。大数据,不是神,也没有多高深莫测,可望而不可己。它只是我们图书馆事业和图书馆人的小伙伴而己。共知共存,仅此而己。
许*新:林那个叫统计分析。专业军人情报参谋基本工作。
广州书童:那个时候计算机都么有,哪来的大数据。大数据是一定年代才出现的。那个时代手工来说就是大数据了。只是为了形象说明一下而已。
许*新:数据用途不离其宗。
广州书童:手工时代你用算盘就是超算,算盘时代你用计算器就是超算,计算器时代计算机是超算,现在终于有超算中心了。
图谋:其实那属于‘大数据思维’范畴。我联想到‘图书馆’这个概念,他出现的时间也不长,但我们可以说‘古代图书馆’。
一直很*:说的挺好的,就让大数据和大数据思维在图书馆界大放异彩吧。大数据思维新名词怎么来的?不争论能出来吗?明年就大数据思维下图书馆得八得八吧。
皎皎孤*:觉得大家说的舍恩伯格和巴拉巴西那些书,讲大数据是有历史感的。
朗月孤舟:南方一大馆长说:图书馆没有大数据。
印度阿三:从量上来看,图书馆的确没有‘大’数据。
郑图:从质上看,图书馆没有做大数据,只有大数据评职称的。
海边:企望从中分析出读者阅读行为,图书馆的读者借阅数据这点上够不上大数据。
郑图:这些够上大数据了。从小处做起,图书馆不缺的是狗头叫的,缺的是具体做的。
广州书童:远远够不上‘大’。几百万条数据,几十万个借还,几万个读者,也能叫‘大数据’。
印度阿三:你们累计个3、40年的外借数据应该差不多吧。
郑图:数据先积累,raw到底,开放,整合都叫大数据。我们是炒概念,而企业是实在的用数据创造利润。
许*新:图书馆现在的数据都是累计统计数据,而且还是搜集不全的数据。
闽南师大陈:图书馆目前还没有大数据,数据挖掘用得较多而已。
许*新:想想图书馆的数据采集设备就知道和大数据没关系。
南大沈*:图书馆没有大数据。没啥可争。
海边:先对大数据弄个共同认可的定义,再争才能明白双方说的是不是一回事。
印度阿三:套用一句广告词:morethanbig。
南大沈*:只是大还不行。
闽南师大陈:倒是可以按照大数据思维去处理尚不足规模的图书馆业务数据和日志。单单做到这点,就需要好多时日和探索了。
南大沈*:嗯。
南大沈*:数据仓库数据挖掘。
南大沈*:做好统计分析都不错了。
闽南师大陈:各个业务系统的数据整合,清洗,建立数据仓库,光数据层就需要折腾非常多时间了。
许*新:能把现在的数据统计的结论不是误差太大不可信就很好了。
许*新:现在的现状有可能今年着去年的数据都找不到了。
星光:陈伟不是学技术出身么,不可能不知道大数据含义吧。
南大沈*:计算机行业内分类,也是360行。我认识一个植物学博士,他研究花,大家可能认为他认识很多花,其实他只研究茶花。很多花不是很认识。
gaozy:博到一定程度就是专。对某一事物专就是博。生活处处辩证法。
图谋:早些年,一说学计算机的,就让修电脑。其实学计算机的,会修电脑的并不多。
南大沈*:对。
星光:计算机专业是学软件的。
南大沈*:那编程厉害。
星辰:写算法很厉害。
图谋:编程厉害的,可能只精通某一种。
cpulib:南大不是数学毕业转计算机行业嘛。
南大沈*:数学里面也分很多。计算数学。
cpulib:编程看兴趣。
星辰:人工智能,机器人。
南大沈*:很多都是看兴趣。
麦子:我劝大家在没有弄懂一个东西之前就不要把一个光鲜的帽子往自己头上套。大家的心情我可以理解,但我们是处于一个没落的一行,再穿新衣服可能也没用。我是什么都不懂,但林*那个例子绝对不是大数据的例子。我在七、八年前听过一个故事:二次世界大战中,英空军在英吉利海峡上空损失惨重,但每次还是有不少被打得千疮百孔的飞机飞回来,有些地方整块东西都没有了,这就产生了一个问题:如何加固飞机结构以提高幸存率。但是,科学家经过分析后建议加强机身上损坏最小甚至完好无损的部位,我们没有看到这些部位损毁的原因是:这些飞机都没有回来。这里使用的研究方法是运筹学,operationalresearch.告诉我这个故事的认识个高中生,他当时想做这行的,但后来发现这东西有了另一个版本:统计学。对了,这中学生现在是一家公司的首席数据官。
南大沈*:林*那个不是大数据,大家没异议。
一直很*:大数据思维使图书馆学研究在不抛弃抽样调查的前提下,越来越使全员数据调查分析成为可能,使图书馆学研究成果在理性科学中更经得起时间的考验。
天涯海角:图书馆如果能把抽样调查做好,就很不错了。
皎皎孤*:这是一个社会学学者的一个看法,或许能提供参照、带来启示。http://url.cn/40mID2m,潘绥铭:‘目前对于大数据已经出现了盲目崇拜,一切皆可量化是其核心口号和基本理论。但是在量化过程中,不可避免地会出现四种情况:剪裁现实生活、忽视社会情境、抹煞主体建构、取消生活意义’。当然这也只是他的观点,于此相反的有人提出建立包括大数据社会学在内的‘大数据XX学’学科。
一直很*:社会学科对大数据的天然警惕和自我反击,源自于社会学科与自然学科的天然差异:一个偏感性,一个偏理性。所以社会学科对大数据会有抵触反制并不令人感到奇怪。那么,图书馆学究竟是社会学科还是自然学科?在图书馆员研究图书馆史的时候它是社会学科,在图书馆员用二进制对图书馆读者数据进行分析的时候它又当然是自然学科。而所有的理论,都是在争论和否定之否定之后才更加成熟或像地心说似走向失败的。所以,不要着急定性,再看看。
顾*:图书馆史是历史学,还是图书馆学?如果只能二选一的话。
一直很*:图书馆史我个人认为应该偏图书馆学,因为数学
以下格式等价,请按需引用或修改后使用:

[1]圕人堂QQ群知识库.大数据(讨论之二)[EB/OL].(2016-10-28)[2024-07-04].http://tuan.pub/server/detail.php?id=2400.

[2]南大沈*,许*新,一直很*,等.大数据(讨论之二)[DB/OL].圕人堂周讯,2016(129):14.

[3]南大沈*,许*新,一直很*,等.大数据(讨论之二)[DB/OL].(2016-10-28)[2024-07-04].http://tuan.pub/server/detail.php?id=2400.