数字化,让古籍触手可及(护文化遗产 彰时代新义)

光山新闻网 采集侠 2024-01-10 11:58:01
浏览

  我国现存古籍约有20万种,修复整理现存的全部古籍,可能需要300余年。古籍数字化迫在眉睫。一本古籍,如何从纸页“搬”到网页?广泛收集图像资料、利用现代技术精细化处理……自2022年10月上线以来,“识典古籍”平台已陆续汇集经、史、子、集等2200余部古籍,免费面向公众开放,为解决古籍保护和利用矛盾进行了有益尝试。

  

  “青蒿一握,以水二升渍,绞取汁,尽服之”,屠呦呦从古籍中获得灵感,由此发现青蒿素;在浩瀚古籍中寻幽入微,竺可桢绘制出一条物候变迁的曲线——“竺可桢曲线”,浓缩出五千年中华大地的冷暖变化图景。

  卷帙浩繁的中华古籍,凝结着先人的智慧,记载着璀璨的文化,诉说着绵延不绝的中华文明。岁月不居,书阙有间,部分古籍正慢慢“老去”,褪色、脆化、腐蚀,甚至稍一翻阅就会损毁。

  当古老典籍遇到现代技术,会产生什么 奇妙反应?

  一种“打开”古籍的全新方式

  “初见”“流光”“惊鸿”“珠联”“缀玉”……点击网页上的标签,《永乐大典》的前世今生、编纂方法、历史价值等信息,伴随着动画音效,呈现于眼前。

  点击页面右上角“阅读大典”,进入文本阅读平台。《永乐大典》原本影像与数字化文本相互对照,繁简体文字随时切换。遇生僻词句,可选中文本,点击“查看引用”,出处清晰可考。

  《永乐大典》是我国古代规模最大的类书,汇集先秦至明初各类典籍,被誉为“世界有史以来最大的百科全书”。但几经散佚,副本存世不及原书的4%。对学者而言,《永乐大典》是进行学术研究的重要资料;对普通读者来说,古籍文本往往艰涩难懂,且接触机会不多。

  如今,《永乐大典》高清影像数据库(第一辑)在古籍数字化平台“识典古籍”正式上线,免费面向公众开放。借助现代数字技术,厚重典籍浓缩在方寸之间,尘封已久的历史画卷徐徐展开,成为触手可及的文化资源。

  “互动化、可视化的呈现方式更加符合当代人的阅读习惯,沉浸式阅读体验拉近了古籍与普通读者之间的距离。”“识典古籍”平台项目负责人之一、北京大学信息管理系助理教授位通说。

  自2022年10月上线以来,“识典古籍”平台已陆续汇集经、史、子、集等2200余部古籍,面向海内外读者免费开放。该平台由北京大学与抖音合作共建,致力于为用户提供免费、公开、稳定、快速、方便的检索和阅读古籍服务。

  “识典古籍”平台项目负责人、北京大学数字人文研究中心主任王军希望,“识典古籍”平台能推动散落海外的中华古籍回流,促成古籍的开放共享。

  一次解决保护和利用矛盾的尝试

  古籍数字化为何迫切?

  王军算过一笔账:我国现存古籍约有20万种,从1949年到2019年,共修复整理出版了近3.8万种,修复整理现存的全部古籍,可能需要300余年。可以说,古籍修复速度赶不上老化速度。

  修复整理,只是数字化的第一步。古籍具有文物和文献的双重属性,修复好的古籍若只被束之高阁,后续研究就无法开展,更无法发挥其文化传承的价值。

  因此,数字化是一场生产效率的变革,也是一次解决古籍保护和利用矛盾的尝试。

  一本古籍,如何从纸页“搬”到网页?

  进入“识典古籍”平台,平台设计者、北京大学人工智能研究院副研究员杨浩开始演示:“古籍的数字化分为两步。一是图像化,我们与海内外古籍收藏单位合作,广泛收集古籍数字化图像资料。二是文本化,利用人工智能技术对古籍文字进行识别、排序、校对、结构整理、标点、实体识别等,对内容作精细化处理。”