探访文溯阁《四库全书》数字化影印出版工程(人民眼·让文物活起来③)(3)
图版处理不易,校对任务也很繁重。文溯阁《四库全书》数据校对人员张静从事古籍校对工作已有10年,但从未校对过如此海量内容。利用数字技术能够提速,但一些讹误很难被发现。
不久前,张静在校对时发现,一个“丸”字疑为“九”字。经仔细核校后确认,果然是因为古籍宣纸里的植物纤维发生霉变,扫描时多出了这一“点”。
起初,一天校对300叶是张静的上限。“刚开始时平均用力,耗时较多。”她说,而今这个数字翻了近3倍,“慢慢地,哪里容易出错、哪里容易变色,心里都有了数,效率提高不少。”
效率高了,胆子却小了。“总担心有错误没能及时发现。”张静回忆,有次下楼吃午餐,饭刚端上来,她又起身赶忙回到办公室,“以为忘了标注一处讹误,打开电脑一看,其实已经做了记录。”
为明确权责,避免误操作,从图版处理到一校、二校,再到最后的质检存储,文溯阁《四库全书》数据处理是条“单行道”。电脑之间不能互相访问,数据传给下一流程后,前一流程的人员将无权再改。
“在数据处理程序软件和制度流程上,我们有一套完整设计,确保数据资源安全。”宋学娟输入账号、密码,登录数字化成果管理系统,所有成品文件呈现在眼前,函盒编码、书名、作者、朝代,以及长、宽、高和册数等基本信息,都有详细记录。“我们争取今年内基本完成图版处理工作。”她说。
影印出版
不少图书馆、藏书机构等正虚位以待,静待“四阁四库合璧”
文溯阁《四库全书》影印出版,汇聚了社会各界的期待。
西北师范大学教授赵逵夫全程参与了文溯阁《四库全书》影印出版工程专家论证会。他说,《四库全书》现存不同版本在内容、册数、卷数上皆有不同,通过数字化影印出版,方便学者比对研究,意义重大。
兰州大学教授汪受宽也持相同观点。他曾用两年时间,带着学生对甘肃省图书馆编印的《影印文溯阁四库全书四种》进行整理、标点和精细校勘,并将收录其中的《易图说》《长安志图》《墨法集要》《璇玑图诗读法》这4种(每种各1册)书,跟文渊阁本进行对比,发现两个版本的文字、图片等存在901处差异。
“4册书就有这么多差异,3.6万多册会是什么样?”汪受宽说,“文溯阁《四库全书》影印出版,将对文化史、史学史、文献学研究等都产生重要影响。”
期望值高,现实问题也不少。一方面,古籍实现数字化后,盗印现象难以杜绝。另一方面,超大规模古籍的影印出版投入巨大,盈利是个难题。“变古籍为现代书籍,背后是大量的人力、物力、财力成本。”读者出版集团有限公司所属甘肃人民出版社社长、总编辑原彦平坦言。
防止数据泄露,采集区域设置严密安保措施。宋学娟介绍,任何人出入采集区,都须经过严格安检,以防手机等电子设备进入工作区域。同时,每个工作台均安装了监控设备,每台电脑都作了加密设置。
应对盈利难题,找准盈利点是关键。原彦平给记者详细分析:古籍影印本主要有仿真本和缩印本。前者好比是“克隆体”,从纸张到字号,从排版到装帧,与原书几乎“一模一样”;后者则是“迷你版”,内容不变,但字号变小、页数变少,册数大幅缩减。“文溯阁《四库全书》若是出全套仿真影印本,成本过高,市场较小。”
原彦平说,文溯阁《四库全书》多达3.6万余册,数据采集、处理、编辑、出版等投入大,且多为手工完成,成本高,发行对象则主要为图书馆、文化馆、高校、研究院所等专业机构和为数不多的研究者。