大数据(并讨论之一)

   圕人堂周讯(总第129期20161028),第12页,海边整理王启云助理   
许*新:我自己的理解大数据是数据流,就如监控头一天对着某个点不停的记录。然后用一些技术对这个数据体挖掘预测有用的东西。前提是科技发展到了能记录储存数据流了。和大规模数据是两个东西。所谓时髦专家特别喜欢把旧东西冠新名词。不管新名词是不是专指了。当然我的理解是个人方便理解的角度,内涵和外延都不全面。
一直很*:大数据、云计算和云平台,直到今天,除了商家炒作,就没有浓缩的概念,能让大多数人明白,这三个到底是什么东东吗?
小洋:云平台我们用得最多的就是远程存储,大数据的话,天气预报应该算。不是什么都需要和图书馆融合的,大数据和云不在图书馆员能力范围内。
一直很*:为什么大数据、云平台和云计算在图书馆界风生水起呢?因为每个馆纸质馆藏量几十万册都是普普通通,数字馆藏几百T都是司空见惯,现在自建资源又日益增多,所以,图书馆需要这三个小伙伴。
麦子:这完全是对大数据的误解,这连数据都不是。
许*新:图书馆讲有多少多少数据库。就是扯呢。
麦子:我们馆从来还没有说过大数据。因为我们根本没有大数据。
南大沈*:拆解大数据http://url.cn/40gKklr,信息主要是收集的,注明了非原创,改天写云计算、虚拟化、互联网+什么的。
麦子:是我看过最好的。大家可以看看。
咖啡:拜读,写的很好,谢谢诶!受用!
印度阿三:看完,感觉科普很好但我最担心的是人在网络时代毫无隐私可言。
麦子:是这样。除非你不上网。
印度阿三:感觉就在裸奔。
南大沈*:嗯,没错。
麦子:我现在手机,板子和电脑上看的任何东西,谷歌都在背后看着。他们有个摘要一样的东西。里面都是和我有关的信息。告诉我家里人的(因为有电邮的行程)坐的飞机是否起飞到达。然后是新闻。都是我关注的话题。
南大沈*:是的。亚马逊可以预测一个地方有多少人会买某种产品,提前就会快递到离你最近的地方。
麦子:这和气候分析也有关。
南大沈*:每个人在逛电商的时候,次数多了,行为其实有内在规律。你的浏览比价,各网站比较,看评价,电商都可以分析到。
印度阿三:设想一下,哪天你刚睁开,阳台上的无人机给你送了一堆话,手纸,牙膏,感冒药都来了,只因为你昨天在网上搜了一下头痛流鼻涕怎么办。
南大沈*:没错。这就是数据的江湖,谁也逃不掉。
麦子:@印度阿三,你这个问题是最基本的。如何去掉背景的噪音。
一直很*:大数据就是数据整合、加工,对吗?在亚马逊,抑或淘宝,通过客户的购买浏览记录对客户定点推送,就是大数据呀,用例证的方式讲出来,通俗易懂,大家就明白了。其实大数据不仅是技术性的优越,更是一种科学而理性的理念。它要求原始数据的全员性而非抽样性,这就对我们进行图书馆学的相关研究提供了启迪:我们用抽样调查的数据去推出结论并论证是否科学?在图书馆里向众人发放你是否喜欢读书的问卷调查统计出民众爱读书的结论是否可笑?统计全省所有图书馆的微信公众号和订阅号并进行研究分析即使数据够不上大数据的定义(当然,片面的定义多少数据才是大数据尚待商榷),可借助大数据的思维搜集了完整的数据得出科学理性的论点又何尝不是大数据在图书馆的应用呢?对于图书馆人来说,我还是要说,大数据不只是一种技术,更是一种理念,是思维层面的一场革命,会让我们的论证更完整更科学,让我们的成果更经得起时间的考验。大数据在图书馆,用的着……我们馆有位同事就花了1个月的时间,统计全省微信的公众号订阅号数据进行研究,我认为,在图书馆的大数据应用上,他就用了,还用活了。大数据的大,不在于几十T几百T的大,我想:它的特点,完整性会优于那个大字。
许*新:全部不代表完整,也可能是记录的少。
图谋:还有一个概念‘小数据’,某些条件下,小数据有小数据的优势。
广州书童:图书馆有大数据吗?我个人认为没有。
图谋:浏览了沈老师的长文,图书馆可以有大数据:一方面,当前大数据的实践,互联网-政府-企业-个人演进;另一方面至少可以有‘大数据思维’。作为个体的图书馆,没有‘大数据’,但‘小数据’或多或少是有的,可以运用‘大数据思维’开展若干工作。吴建中.上图大数据互动屏开放啦.http://blog.sina.com.cn/s/blog_53586b810102wkxq.html。上图的‘大数据互动屏’大概可以算是图书馆界对大数据探索与实践的案例之一。
小洋:谁能讲一讲,上图那个大数据是咋会事?还有显示屏,看起来像科技馆设备一样。
惠*澈:实时数据,5分钟更新一次,进馆人数,借还书数据,分馆数据等,一目了然。
南大沈*:上图大数据那个,我觉得叫数据展示就可以了,核心其实就是统计、展示甚至没有分析。有好几家公司在做这个事情。就是拿图书馆的书目数据、读者信息、门禁系统等等,展示在大小屏上,实时显示,可触摸的屏也可以作为智能书架的一部分。
1.5即兴讨论
  1. 大数据(讨论之二)
  2. 奉献给圕人的大礼包——圕主题特色数据库,感谢www老师(研制与管理运营者)、boner老师(每期周讯更新者)!
  3. 初景利老师“从资源能力到服务能力”微信讲座的讨论(一)
  4. 关于大数据与图书馆的讨论
  5. 编目图书著录码洋和实洋价格的讨论(续上一期图人堂周讯)
  6. 初景利老师“从资源能力到服务能力”微信讲座的讨论(二)
  7. 新书推荐:《中国音乐史•图典版》、《图书馆情景规划理论、方法与应用》、
  8. 大数据时代的信息素养教育与创新人才培养学术研讨会
  9. 大数据时代的信息素养教育与创新人才培养学术研讨会
  10. 循证图书馆学、证据数据库及圕人堂周讯整理小软件的讨论。
  11. 关于涂子沛《大数据》的讨论。
  12. 对内蒙古图书馆新的资源建设方式的讨论:(彩)云服务平台
  13. 海外管理员与馆员职位区别的讨论(一)
  14. 高校评估测算图书文献数量时,报纸合订本算一册吗?
  15. 用户对读秀数据库的使用意见以及关于图书馆服务质量定义的讨论
  16. 圕人堂建群逾 3 月,形成并确立堂风为:贴近现实,关照现实,联系理论,
  17. 如何成功地在国际图情期刊上发表论文?像讲故事一样研究与写作
  18. 关于天津图书馆、东莞图书馆、浙江省图书馆、莱阳图书馆、广东图书馆、法国国家图书馆黎塞留分馆的书架摆放和格局的讨论,尤其是高处书籍的摆 放 设 置 。
  19. 同一种书的两次上榜,虽然版本不同,但汇总结果是不是应该合并在一起?
  20. 关于大数据的讨论。
以下格式等价,请按需引用或修改后使用:

[1]圕人堂QQ群知识库.大数据(并讨论之一)[EB/OL].(2016-10-28)[2025-04-04].http://tuan.pub/server/detail.php?id=2398.

[2]麦子,南大沈*,许*新,等.大数据(并讨论之一)[DB/OL].圕人堂周讯,2016(129):12.

[3]麦子,南大沈*,许*新,等.大数据(并讨论之一)[DB/OL].(2016-10-28)[2025-04-04].http://tuan.pub/server/detail.php?id=2398.