何志华 - 「汉达文库」: 结合传统与现代中国古籍数码化|博文通识
2024-01-29 11:34
自古以来,从事国学研究最艰巨的工作,莫过于处理浩如烟海的文献资料。从前,天资聪敏、识力过人的学者,光靠习诵记忆,可以董理古籍而条贯于胸,全祖望《鲒埼亭集》记述清初学者顾炎武「或径行平原大野,无足留意,则于鞍上默诵诸经注疏,偶有遗忘,则即坊肆中发书而熟复之」,可见顾炎武不惟可以随意背诵《论语》、《孟子》等《十三经》经文,还熟读《十三经注疏》。今天,研究人员已将《十三经注疏》输入电脑,经电脑核算,得知《十三经注疏》合计达870多万字;现代社会生活繁忙,实在无法想像古人这种非凡的记忆力。可惜,像顾炎武一类潜心学问的读书人,毕竟千载难逢;常人研习国学,为求掌握文献资料,只得借助电子检索工具。
全港首个古文献网络资料库
利用电子科技,系统地整理中国传世古籍,必须依赖学术机构长期的构建和参与。在香港,大规模的古籍整理研究工作,为数甚少。香港中文大学于1989年开展古文献电子资料库的建构工作,将自先秦以至魏晋六朝的一切传世文献,合共超过3000万字,悉数输入电脑,然后利用程式,进行文献之排比与检索。在文献输入之前,研究团队仔细比对不同版本,选择其中旧刻善本又未经后人改动的,然后重新标点,并记录其他版本异文、传统类书引文,及其他文献所见重文。整理过程并非仅将文献资料由「书本形态」转变为「电脑可读形态」,而是一次有系统的文献整理工作。
上世纪90年代起,互联网应用日渐普及,中心决定将历年所建中国古籍及出土文献资料库,包括甲骨文、金文、竹简帛书等载体,总合结集而成「汉达文库」(Chinese Ancient Texts Database,简称CHANT),并编制网上检阅程式,于1998年成功建设于互联网上,并向全球学者开放使用,以便学者在互联网上随意检阅逾千种传世古籍及出土文献。「汉达文库」乃香港首个古代文献网络资料库,至今已建成7个资料库,包括「先秦两汉文献」、「魏晋南北朝文献」、「竹简帛书文献」、「甲骨文」、「金文」、「传统类书」及「古代词汇」,共收录超过8000万字。文库涵盖上古时期中国文化的辉煌岁月,兼及不同地域文化,齐鲁秦楚,吴越淮南,兼收并蓄;涵盖时代由殷商到魏晋六朝,举凡传世典籍以及出土文献,乃至唐、宋、元、明所编类书,皆所庋藏。我国远古的璀璨文明,读者可以弹指之间,从容浏览。
全球学术界广泛使用
目前,世界各地已建立不同的中国古代文献资料库,惟有「汉达文库」愿意投放大量人力及时间于文本整理工作上;典藏旧籍、吉金文辞,皆依善本;校雠比勘,对比异同,钜细无遗。刘殿爵中国古籍研究中心更一再拓展研究范围,成功将古籍词汇数据化,建成「古代词汇资料库」。研究人员利用词汇资料库,更推翻了学术界一些被视为「必然」的学术定论。1973年,在河北省定县出土的竹简《文子》,学者普遍认为成书年代在战国中后期。笔者在1998年发表论文,率先发现竹简《文子》提及「朝请」一词,利用词汇资料库,得见「朝请」其实汉朝律例,表示诸侯春、秋两季朝见汉帝的律则,从而证明出土竹简《文子》不可能成书于战国时期,而必为汉初成书的典籍,相关论点获全球《文子》研究学者广泛引用。
30载深耕细作,学术研究最终转化为教研工具,植根香港的「汉达文库」,今天已广泛为全球学术界使用,作为付费使用的文献网站,文库订户来自亚洲、欧洲和北美洲等15个国家,哈佛、耶鲁、普林斯顿、牛津、剑桥、北大、清华、台湾中研院等80多间欧美及中国重点学府,均为长期用户。过去一年,文库点击率逾40万次。研究中心不断改进系统介面,以协助中国古代文化的教研工作。近年完成架构重建工程,增设跨文献载体(甲骨、金文、竹简、纸本)、年代(上古、西周、战国、秦汉、六朝)的检索功能,图文对照,并致力涵盖更多古籍,冀扩大学术影响力。
文:香港中文大学卓敏中国语言及文学教授、刘殿爵中国古籍研究中心主任何志华
本栏欢迎院校学者投稿,分享个人学术见解及研究成果,1400字为限,查询及投稿请电邮︰[email protected]。
文章刊于《星岛日报》2024年1月29日教育版专栏「知识转移」。
延伸阅读:
海尔格.诺沃特尼 - AI世代 如何保有生而为人的意义|博文通识
李立峯 - 应对虚假资讯:事实查证的专业化和影响力|博文通识
《星岛头条》APP经已推出最新版本,请立即更新,浏览更精彩内容:https://bit.ly/3yLrgYZ
最新回应