探访文溯阁《四库全书》数字化影印出版工程(人民眼·让文物活起来③)
图①:读者古籍数字科技中心工作人员对文溯阁《四库全书》数字化文件进行质检。
本报记者 王锦涛摄
图②:甘肃省图书馆依托文溯阁《四库全书》开发的文创产品。
图③:甘肃省图书馆文溯阁《四库全书》藏书馆工作人员巡查书库。
图②③均为甘肃省图书馆提供
图④:甘肃省图书馆文溯阁《四库全书》藏书馆主楼。
本报记者 王锦涛摄
引 子
登临兰州北山九州台,甘肃省图书馆文溯阁《四库全书》藏书馆跃入眼帘——馆楼飞檐翘角,踞北山而瞰黄河。
自正门入楼,穿鞋套,做登记,进书库。书库恒温恒湿,1128个香樟木书箱层层叠叠,收录典籍6141函、3474种、36315册的文溯阁《四库全书》就安放于箱中。
2023年6月,习近平总书记在中国国家版本馆中央总馆考察调研时,详细听取《四库全书》版本源流、纸张印刷、保护收藏等介绍,叮嘱工作人员:“我最关心的就是中华文明历经沧桑留下的最宝贵的东西。中华民族的一些典籍在岁月侵蚀中已经失去了不少,留下来的这些瑰宝一定要千方百计呵护好、珍惜好,把我们这个世界上唯一没有中断的文明继续传承下去。”
《四库全书》编纂于清代乾隆年间,是我国历史上规模最大的丛书,修成后誊抄7部,分藏于紫禁城文渊阁、圆明园文源阁、盛京(今沈阳)文溯阁、承德避暑山庄文津阁、杭州文澜阁等地。目前存世三部半,分别为文渊阁本、文溯阁本、文津阁本,以及被称为“半部”的文澜阁残本。其中,文溯阁本辗转多地,于2006年入藏现在的藏书馆,也是“三部半”中唯一尚未完整影印出版的一部。
为了让书写在古籍里的文字活起来,经过长期缜密的筹划论证,2021年8月,甘肃省正式启动文溯阁《四库全书》数字化影印出版工程。
目前,文溯阁《四库全书》数字采集工作已全部完成,数据处理工作完成70%。从现在起至2028年,文溯阁《四库全书》将按经、史、子、集四部,分期分批推出全套影印版本。
数字采集
采集方案、流程规范和相关作业标准周密完善
约8亿字的文溯阁《四库全书》共有多少页?数字化之前鲜有人知。
“换算为现代书籍页码,共488万多页。”文溯阁《四库全书》数字化影印出版专职工作组组长宋学娟说。
作为读者出版集团有限公司所属的读者古籍数字科技中心总经理,宋学娟过去两年多时间带领团队把文溯阁《四库全书》从纸上“搬进”了电脑——逐页扫描、存入,数据资源总量逾700TB(太字节)。“如果用常见的容量32GB的U盘存储,需要2.2万多个才能装下。”宋学娟说。
文溯阁《四库全书》既是历史典籍,又是珍贵文物。若藏于高阁,难以活化利用;若活化利用,又有损坏之虞。如何破解“藏”“用”两难?2021年8月,甘肃省委宣传部制定《文溯阁〈四库全书〉数字化影印出版工作重启方案》,力求在保护的同时“唤醒”古籍。
古籍真本由甘肃省图书馆提供,数据采集处理、影印出版等工作由读者出版集团有限公司具体实施。数字化影印出版工程分为“数字采集—数据处理—影印出版及数据库建设”3个阶段。所需经费,部分由中央文化产业发展专项资金、甘肃省财政资助,部分由读者出版集团有限公司自筹。
数字采集,免不了要接触古籍真本,如何确保其安全无损?甘肃省图书馆和读者出版集团有限公司制定了周密完善的采集方案、流程规范和相关作业标准,“54条数字化工作流程规定,涵盖前期准备、文献出库、数据处理等全部流程。”宋学娟介绍。