图书馆古籍数字化

   圕人堂周讯(总第350期20210122),第18页,宋晓莉 整理 王启云 助理   
biochem:‘古籍与文创’图书馆古籍鉴定研修班招生!学员申领电子培训证书须缴纳服务费,中国图书馆学会个人会员200元/人,非个人会员280元/人。免费就好了。
天天:1.现在已经数字化的有多少,都是谁?2.我一对比,我这儿的地方资源还没有数字化,这个活儿可做。3.基于企业数字化的扫描件再数字化操作易,但后期工作量也不小,还要再校队,因为很多古字计算机根本识别不了,不要过于迷恋计算机技术,有些活儿它根本替代不了人.4.扫描古籍文献是歧途还是中转站?
毁人不倦:这个问题比较麻烦但对于中小馆来说,绝大多数普本古籍是没有扫描、再造价值的现在爱如生的普本量还是很大如果有珍藏本、独(特)本含名家钤印或批校本还是值得折腾一下。如果觉得古籍扫描完了就可以用了,那这个活还是想简单了不能全文检索,就等于无用功如果要全文检索,文字识别、校对这个功夫就很久可以说没有一定基础的基本无法做包括爱如生对比影印版和全文版就可以发现其中不少文字上的错误当然这个错误是有多种原因,不一定都是不仔细的问题。
天天:@毁人不倦不能全文检索的资源,学术利用价值就根本得不到体现,干守着等后代人来做。。
二木:数字化不是目的,数字化是基本工作,是迈出的第一步,第一小步。如果连基本的第一步都不去走,都走不下去,谈别的都没有意义。
万寿寺*:古籍数字化的成本是很高的,一步到位不现实。
二木:到企业走一走,成本控制有的是办法。
天天:清末以后的各地报纸,学术利用价值多高啊,还有多少没数字化实现可全文检索的。
万寿寺*:企业确实有办法,但是企业要生存要赢利。可惜很多时候图书馆因为观念守旧和贪心,不懂得让利共赢的道理。
毁人不倦:数字化的长期、规范、系统、标准、全面,这几条凭图书馆来做很困难。
毁人不倦:爱*生也不便宜,有些是可以检索的,没有全部操作过原来用它查民国报刊还是可以检索全文的。
毁人不倦:我看了下爱*生好像没有盛京时报。
万寿寺*:国图出版社的民国报纸库有,支持全文检索。
欣然读书:先进中国图书馆学会的公众号,点击下面的古籍研修就可以了。
鲲鹏展翅:https://appdg5v06dv1686.h5.xiaoeknow.com/v1/auth?redirect_url=https%3A%2F%2Fappdg5v06dv1686.h5.xiaoeknow.com%2Fcontent_page%2FeyJ0eXBlIjoxMiwicmVzb3VyY2VfdHlwZSI6NCwicmVzb3VyY2VfaWQiOiJsXzYwMDNjYmM3ZTRiMDBmZjRlZDEzYTYwZCIsInByb2R1Y3RfaWQiOiIiLCJhcHBfaWQiOiJhcHBkRzV2MDZkVjE2ODYiLCJleHRyYV9kYXRhIjowfQ%3Fentry%3D3%26entry_type%3D0。
碧沚东楼:民国文献除了各馆自藏文献及数字化工作之外,起码要向读者提供基本常备民国文献服务,主要是备有主要民国报纸如《申报》等大报的数据库或影印本(如报刊索引大成爱如生瀚堂),也要备有民国图书档案影印本或数据库(比如二档馆影印文献),有条件但没有经费的图书馆,可以向读者推介免费的民国数据库,比如抗战文献数据平台。数字化工作扫描难在扫描文本的标准化,国图有比较好的规范,但真正难的在于平台功能搭建,需要外包平台引入。但任何检索文本现有技术都会有误差,因此任何人做学术研究引文还是回归文本校对。
万寿寺*:没错,图书馆自身的人力资源根本不足以完成这些工作的,也没有必要为这种阶段性的工程增加更多的人,与企业合作是最佳选择。在这样的工程中,图书馆方应该作为文献的收藏者和文献整理专家的角色来自我定位。
碧沚东楼:图书馆的文献数字化工作中不是把所有自藏古籍民国文献和特定文献都数字化,而是要做好数字化底本的筛选者,比如稿抄本、批校本、善本和清中后期的不太为传统文献学重视的刻印本。此外还要做好文献数字化过程中的目录标引工作,因为图书馆检索目录提要(330)注重检索功能,提要撰写中同位词等词汇比较重要,而数字化目录提要就是一篇简短扼要的影印前要,考察版本源流,述明文本价值。少数民族地区图书馆可能数字化更特殊一些,要把文本再造保护数字化一起做,大的民族文献和小的民族文献保护可能又不一样,维文藏文文献这两年比较好,小的方面我觉得文成馆的畲族文书做的很好。可能我在浙江,相信其他地区也有好案例,比如东巴文献。
万寿寺*:图书馆的专业性和不可替代性之根本所在。
麦子:@碧沚东楼要做到你说的这些,第一步是要做全国这类资料的编目和馆藏细目的整理,而且一定要有一个全国性的委员会来指定标准。这些如果靠外包之类,还是不要做的为好,因为如果制造大量垃圾数据的话,后果严重。
碧沚东楼:编目成果可以利用古籍和民国文献普查成果。标准其实我记得有些地方和国图都定了标准,需要推广。落实是难题。
万寿寺*:编目方面,国图和CALIS两方都已经有了相当数量的数据积累。
麦子:我自己做不来这些,但见过做的好的计划是怎么做的,花了怎样的时间和精力。
万寿寺*:标准2010年好像就出了,是北大和国图联合研发的。
麦子:没有人出钱和全面落实,是什么都做不成的。这类东西极其费钱和时间,但做完了,只是一个目录而已,没有任何光鲜的东西,所以是最难落实的。我是太理解这点了。这需要有大量的金钱和专业人士和时间做铺垫,只能在有大量钱可以烧的情况下才能做。你们看现在是做这类东西的时机吗?
万寿寺*:单纯的目录的确价值有限,但是与对象数据结合起来,这样的文献数据库还是有市场的。
麦子:我第一个工作,在我工作之前10年就开始了,1982年,现在快40年了,还在做的当中。估计再过10年可以做完了。
麦子:@万寿寺路痴@万寿寺路痴如果以想赚钱这个角度,要做好的话,很难。这应该是一个国家行为。当然,估计古籍和民国文献的量有限,花点钱,10年时间,还是能做完的。
万寿寺*:赚钱和公益并不是非黑即白的关系吧。企业方面,古籍数字化现在做得好的也不少。比如中华书局旗下籍合网,学术带队的是北师大古文献学毕业的博士后,技术合作是北师大语言研究所,保证了数字化产品的准确性和学术深度,已是学界公认的品质保证。企业虽然趋利,但是从长期来看,没有品质利也是不可求的。
麦子:这点当然,如果能赚钱更好,但要从不能赚钱着手,如果光想赚钱,这事‘落实’就很难,这你自己也说了。
万寿寺*:反倒是图书馆这里,看上去淡泊名利,却也为不作为留下了足够借口。
麦子:这种事,要有有几个有雄心的业内人士起头,但一眼望去,似乎没有这样的人。总体讲,图书馆业内能人不多。你想,能人呆在图书馆干什么?当然,我是以草包之肚测能人之心。能人一般城府比较深,不露真相。
万寿寺*:事情其实一直有在推进,只是成果方面,参与者、使用者都知道,图书馆界对这方面进展疏于关注,这是图书馆方的问题,也从侧面反映了行业的痼疾,实在是令人遗憾的事情。

  1. 哈佛图书馆古籍文献的数字化并开放存取
  2. 陕西省图书馆与陕西龙脉云信息科技有限公司联合举办“人类的文化与文明”数字文化系列展览
  3. 英国谢菲尔德大学图书馆馆藏复本量以及馆藏数字化的问题。
  4. 图书馆是否优先采购数字化(数据库)版本?
  5. 《ChatGPT对图书馆工作的影响——圕人堂专题讨论综述》入选中国知网《学术精要数据库》高被引论文
  6. 高校图书馆占座问题结语:各抒己见,畅所欲言,圕人堂的魅力在于平等自在
  7. 求教图书馆购买手机移动数字图书馆的问题
  8. 《图书馆论坛》“数字人文”专栏征稿
  9. 关于图书馆发展方向的书籍和报道内容的讨论
  10. 《2013年~2017年〈图书馆研究〉载文作者、机构及关键词共现——基于文献计量及Citespace的可视化图谱分析》
  11. 会议分享:“图书馆数字治理与知识服务创新”论坛暨江苏省高校图工委成立40 周年纪念会
  12. 从每天躲图书馆“假装上班”引发的议题:图书馆能否建立协助人们再就业的服务中心?
  13. 说说图书馆里的那些“古籍”收藏
  14. 图书馆系统获取数据库平台的元数据,是不是要取得数据库商授权?
  15. 《学术型图书馆馆员如何启动数字人文项目》一文引发的思考
  16. 《高校图书馆员数字素养测评表》及引发的问卷调查设计中应当注意的问题
  17. 国内外高校图书馆馆藏图书复本数量的确定标准
  18. 关于图书馆占座现象、选位系统、读者人数和座位数比例标准的讨论。
  19. 圕人堂服务体系对《2020年中国高校图书馆基本统计数据报告》科学普及的“成绩”
  20. 《图书馆论坛》第9期电子版已于9月3日在圕人堂群文件中分享。这
以下格式等价,请按需引用或修改后使用:

[1]圕人堂QQ群知识库.图书馆古籍数字化[EB/OL].(2021-01-22)[2024-07-04].http://tuan.pub/server/detail.php?id=8500.

[2]万寿寺*,麦子,毁人不倦,等.图书馆古籍数字化[DB/OL].圕人堂周讯,2021(350):18.

[3]万寿寺*,麦子,毁人不倦,等.图书馆古籍数字化[DB/OL].(2021-01-22)[2024-07-04].http://tuan.pub/server/detail.php?id=8500.