徐加跃:人工智能在金文研究中的应用

2024-05-24 来源:中国社会科学网-中国社会科学报

微信公众号

分享
链接已复制

  近年来,人工智能技术取得了飞速发展,基于深度学习的人工智能模型在计算机视觉、自然语言处理、语音等领域实现了重大突破。特别是图像识别等方面,在某些任务中人工智能已经超越了人类的水平。这些技术已经广泛应用于工业界及日常生活中。2022年11月,以ChatGPT为代表的大语言模型诞生,展示了惊人的语言理解和文本生成能力。ChatGPT不仅能和普通人进行自然的交流沟通,还在翻译、文本润色、编写程序等方面展现出与人类专家相媲美的能力,这也引领了人工智能领域的新浪潮。将人工智能领域的先进技术应用到金文研究这一传统学科中,有助于解决金文领域的诸多问题,具有极大的历史意义和社会价值。本文将介绍人工智能在金文研究领域已经取得的相关进展。

  金文是铸造或刻划在青铜器上的文字,在古文字材料中占有十分重要的地位。其年代从商代中期一直延续到秦汉,时间跨度长远;内容涉及广泛,包括祭祀、宴享、祈福、册命、战争、特殊记事等多个方面。所以金文具有重要的价值,结合人工智能技术研究商周金文也具有广阔的空间。

  金文字形识别,即识别金文形体,是学习、研究金文的基础。使用人工智能技术识别金文字形,需要先对金文拓本图像进行切字,继而进行标注,再对切出的单个字形图像使用深度学习模型等进行识别。这项工作面临的挑战是训练具有识别金文字形能力的模型,需要海量的训练数据,因此学者需要人工完成大量的资料整理工作,这将耗费很大的人力物力。此外,金文字形存在数据不平衡的问题。有些字形在金文中出现频率很高,有些字则极为鲜见,甚至有相当多的单字仅出现一次。而深度学习等模型需要每个字形出现频率近似,这样训练才能达到最佳效果,因而需要对原始数据进行增广或对模型进行相应的修改。不过从技术实现的角度来看,金文的字形识别问题和人工智能中传统的图像识别问题几乎是完全等价的,而图像识别正是人工智能的优势领域。基于此,近年来国内很多学者在此方向进行了实践。2018年,中国人民大学李文英等收集了77个单字、2102张字图的金文字形数据集,测试了深度学习模型在金文识别上的效果。2020年,西安建筑科技大学赵若晴等采集《新金文编》上的数据,共收集306个单字、3120张字图,并测试了支持向量机模型在金文识别上的效果。2020年,昆明理工大学尚振宏等也采集《新金文编》上的数据,共收集106个单字、7672张字图,并尝试训练用于金文识别的轻量级深度神经网络模型。2021年,华东师范大学吴炫奇实现的基于深度学习的商周金文文字识别模型,所采用的数据是目前金文领域数量最多的,共收录8453个单字、约120000张字图。这一方向的相关研究大多侧重于理论,成果也多以学术论文为主。

  金文文字识别使用的是拓本图片切字后的单个字形图像,其他古文字单字图像的物理特性与之是相似的,利用人工智能技术进行识别时采用的也是完全相同的步骤。因此,可以设计针对所有古文字的识别模型,将金文、甲骨文、简帛文字等不同载体的古文字集成到一个模型中进行识别。这样做的好处是可以显著增加模型使用的数据量,减轻数据的不平衡问题,从而提升整个模型的健壮性。我们曾专门对此做过研究(《基于人工智能技术的古文字研究》),整理了包含甲骨文、金文、楚简文字的数据集,其中单字共6941个、字图556390张,利用深度学习模型完成了识别工作,实验结果颇令人满意,基于该模型的应用平台也即将上线运行。当然现有的金文文字识别模型也存在一定的缺陷。例如,只能识别已释字,对于金文领域存在的大量未释字,现有的人工智能模型帮助有限。利用人工智能模型对金文中的疑难字和未释字进行考释,是目前这一领域研究的重难点。

  金文字形检测是自动检测拓本图片上的金文字形的过程,检测结果可以用来对字形进行自动切分。切字是古文字研究中的常见工作,非常烦琐、耗时。金文字形检测会使研究者免除大量的手工标注工作。目前,关于金文字形检测的研究成果并不多见。2021年,华东师范大学匡博尝试使用深度神经网络模型检测商周金文拓片和魏晋南北朝石刻字拓片上的古文字及石刻文字字形。模型所采用的商周金文的数据集共包含1397张拓片、19451个字形,其实验结果表明,即使面对相当复杂的青铜钟拓本这类数据,模型也可以准确检出文字的位置信息,具有很好的实用性。2022年,华东师范大学郝斯尘尝试使用Transformer模型来检测商周金文拓片和魏晋南北朝石刻字拓片中的文本框,即该模型可以实现拓本的自动分行。模型所使用的商周金文数据集共包含1394张拓片,文本框共3040个。该模型不但可以识别竖向的文本框,还可以识别拓本中倾斜的文本框。其实验结果表明,该模型在文本框检测任务中取得了较高的精度。虽然该模型不能直接识别单字,但是成功识别文本框对古文字研究者也会有所裨益。从现有的研究结果来看,利用人工智能技术检测金文字形已经取得了很好的效果,不过还存在着数据集规模较小,以理论研究为主,缺乏面向公众的平台等问题,未来该方向还有很大的研究空间。

  断代也是金文的重要研究方向,欲解决这一问题就需了解金文的载体——青铜器,确定了青铜器的时代,其上面铸造的金文时代也就自然明确了。然而,青铜器分期断代难度较大,门槛很高,主要通过学者的知识积累与实践经验来实现,因而只有少数专家才掌握这一专业知识。青铜器的器型和花纹特点是判断时代的重要依据。林巳奈夫先生指出,“器物的形制和纹饰是随着时代变化的,属于同一个时期的器物在形制和纹饰上具有共同的特征”。其说甚确。同时,不同时代器物的形制和纹饰的演变也存在一定的规律,如果把青铜器的图像搜集起来,以青铜器的年代作为类别,就可以把青铜器的断代问题转化为人工智能最擅长的图像识别问题。我们也在这一领域进行了尝试,建立了嵌入知识的深度学习模型,将时代、器型、纹饰等知识嵌入深度学习模型中,从而最大化模型的断代能力。除了理论研究外,我们还开发了面向公众的“吉金识辨·青铜器智能断代与辨类”微信小程序。目前,用户只需上传一张青铜器图片,小程序就会调用深度学习模型,辨识出图中青铜器对应的器类和时代。该程序的出现降低了青铜器断代这一专业工作的门槛,现已完成青铜鼎和青铜簋的断代工作,并计划在未来逐步完成其他器类的开发工作。

  古文字学虽然属于冷门、“绝学”,相关的研究人员并不多,但是领域内很多专家学者一直致力于将人工智能的技术应用到古文字领域,解决本领域的学术问题,尤其是减轻研究人员的工作量、提升研究人员的工作效率以及更好地向公众普及古文字的专业知识,从而推动古文字领域的发展。中华优秀传统文化源远流长,很多人工智能领域的专家学者也对中华优秀传统文化以及古文字有着浓厚的兴趣,期待人工智能技术在古文字领域投入使用。将人工智能应用到金文研究领域目前已经取得了一些喜人的进展,相信未来将会取得更大的突破。

  (作者系吉林大学考古学院“古文字与中华文明传承发展工程”协同攻关创新平台博士研究生) 

关键词:人工智能、金文、“绝学”
转载请注明来源:中国社会科学网【编辑:张云华(报纸)苏威豪(网络)】