以ChatGPT、 DeepSeek、Grok3为代表的人工智能大模型,基于神经网络的机器学习,通过有史以来最庞大的数据量训练集、最强算力,催生出爆发性的智能行为。从长时段历史的角度来看,2023年3月ChatGPT4.0发布,可以说人类正式进入人工智能时代。2024年12月至2025年1月,DeepSeek-V3与R1发布,2025年2月Grok3发布,证实了人工智能的飞速发展与激烈竞争。人工智能科技将重新定义人类知识的边界、改变人类认知过程、重塑人类社会政治和经济结构,人类真正进入“前所未有之大变局”。人类社会科技界、社会生产行业、服务行业、教育界、学术界等将会受到重大影响并发生重大变革,历史学也概莫能外。
历史研究新趋势引起重视
随着人工智能的迅速发展,历史研究也出现了一些新的趋势。
第一,从文本驱动转向数据驱动。人工智能科技促进了历史学研究范式的转变,即从文本驱动转向数据驱动,从而构建数据驱动的新研究范式。传统的历史学研究主要依靠学者们单打独斗式的文本阅读与分析,每位学者穷其一生所能阅读的文献有限,但人工智能科技可以基于海量的样本进行分析研究。这将会改变历史学研究的问题提出、结论观察,继而衍生新的问题,以此循环,形成大规模的研究突破,乃至颠覆性的认知。基于海量数据的可能性,将推动历史研究从“细读”转向“远读”,为更长时段、更大时空范围内的研究提供可能性,由此带来前所未有的结论,更好地寻找和发现历史的规律与底层逻辑。第二,打破语言壁垒。以ChatGPT、DeepSeek为代表的大模型在阅读能力、思考的广度与深度上都产生了颠覆性的飞跃。大模型帮助人们打破了语言壁垒。传统历史研究,复杂、多样、古老的外文文献的阅读始终是一堵高墙,需要花费极大的精力攻克,但人工智能大模型的出现,帮助人们打破语言壁垒,实现无障碍阅读。当下,ChatGPT对于英语的处理尤其出色,DeepSeek则在中文语料上显示出无可比拟的优势,中文也因其语言简洁意涵深厚的特征,在人工智能底层思维逻辑上呈现巨大优势。在可预见的未来,各个语言之间的壁垒将会进一步被打破,精准度将会进一步提升,智能大模型也将会被更多地应用于古文字破译、残稿破解等高难度工作。第三,赋能文本阅读与文本分析。人工智能大语言模型在文本阅读与分析处理方面有出色表现,可以帮助学者进行文献梳理、研究设计、收集数据、分析数据乃至进行理论生成,从而为历史学及其他人文社会科学研究赋能。目前,无论是国外还是国内出品的人工智能模型和应用,在文献阅读、要点提炼等方面,都体现出极高的智能性。第四,人机协作的工作模式。人工智能科技所带来的机遇与赋能将从根本上改变学者们的工作方法,即从传统的案牍工作转向人机协作。大语言模型可以基于人提出的问题进行文本收集、数据分析乃至理论生成,并在此过程中进一步提出研究问题,采集数据、分析结论,由此形成闭环。因此,未来的研究不是怎样使用人工智能作为一个工具,而是以它为主导的一个科研过程。虽然人机协作,但人工智能的作用会越来越占据主导,而人将会发挥一种辅导作用,扮演的是教练或导师的角色,即人来引导、提出问题,然后通过提示、指引来参与研究。以后的研究很有可能关键点在于谁更擅长于跟人工智能对话,谁更擅长应用人工智能。人工智能的出现建立了一片新高原,研究者需要在新的高原上建立高峰。它要求研究者具有更丰富的想象力、更好的全局把控力和洞察力。在新技术普及的情况下,研究水平的高低取决于个体跟人工智能协作的能力。第五,“数字人文”向“数智人文”跃迁。“数字人文”受到数字技术与人文学科发展的双重影响,直接连接了各类计算机技术与算力,从而改变了传统人文学科分析和处理资料的方法、观察和描述人类行为与社会现象的角度,以及呈现分析结果的形式。数字人文像一个“学科共同体”,吸收了来自语言学、文学、历史、地理、计算机、图书情报学等各个学科的理论、方法与工具,并为之赋予多元发展动力。当下,随着人工智能科技的发展,“数字人文”将在技术上进一步跃迁,直接承接人工智能大语言模型的惊人算力、模型建构、模态模拟、自动化分析、理论生成等数智技术手段,这意味着“数字人文”转向“数智人文”。第六,史料从文本转向数据。人工智能时代的推动力源于数据。人工智能时代下,从个体的人到整体的人类社会生产生活活动都被数据化,以数据的形式被存储于后台数据库中。史料将从物质性的文本,转向非物质性的数据,这将改变未来历史研究的史料形式。历史学家也不再奔走于传统的档案馆,而是周转于各个数据库之间。
警惕数据安全问题
人工智能时代的核心基础在于数据,对于历史研究而言,这也会产生一些新的值得警惕的问题。
第一,数据沙漠问题。历史学家需要注意数据沙漠的问题。史料的数据化,在全球时空范围内,存在区域和时间上的巨大不平衡性,但这并不意味着没有史料或没有数据的地方就没有历史,要注意那些被忽略的误以为“没有历史”的人群与地区。不仅如此,史料的多元性应受到更大的重视。除了文本数据之外,数据化了或未被数据化的图像、考古、实物乃至气候、环境等多元信息和材料,都应被整合,以避免单纯文本数据可能带来的偏狭与误读。第二,数据背后的意识形态问题。在数据检验方面,有一个不可忽略的重要问题,即数据投喂背后的意识形态问题。我们要看到美国人工智能科技背后的资本所代表的意识形态。比如,ChatGPT大模型能够面世,必须要经过与美国的主流价值观的“对齐”审查。再比如,ChatGPT受到训练数据中不同观点的分布影响,偏向于欧美价值观。此外,ChatGPT很容易继承和放大训练数据中存在的偏差,表现为对不同人口统计数据的歪曲表述或不公平待遇,例如基于种族、性别、语言和文化群体的不同观点与态度。所以,在既有的以及未来的人工智能科技中,科技并不是想象中的“中立”,科技背后的意识形态问题,算法偏见带来的人文价值偏差,是人文学者、历史学者尤其要警惕的。第三,学术伦理与科研规范问题。从当下的发展态势来看,数智科技还面临着学术伦理与科研规范问题。目前,国际上多所大学已出台对人工智能生成文章的管理办法。自2023年1月起,《施普林格自然》《科学》等期刊都禁止使用ChatGPT生成的文本,也禁止将之署名为作者。可以预见,针对学术界的人工智能使用规范也将不断制定和完善。第四,人被取代的焦虑问题。人工智能时代的核心在于数据,因此,在基础数据的生成、数据喂养以及提出研究问题三个方面,人始终具有不可取代性。在历史学领域,史料是重中之重,因此,在基础史料(数据)的生成、史料的提取与训练方面,人依然具有主动性。不仅如此,在历史研究中,问题的选择与设定、历史的解释与价值赋予,历史学家依然具有主动性。历史学家的人文关怀、时代关怀也仍然具有珍贵价值。在这些方面,人始终具有不可替代性。
1987年,“奇点”理论家们预言:“计算机能力的增长趋势将在不久的未来继续加速,这将最终引发一场智力失控,人工智能科技的指数级增长将导致具有自我完善能力的超人类智能机器的发展,从而引发前所未有的技术和社会颠覆。”这一点在人工智能科技大爆发的今天,无疑得到了验证。随着人工智能大模型的发展,赛博格、生物技术、DNA编译等技术的成熟,可以预见,人工智能科技的未来可能是一种超人类的未来,世界可能发生颠覆性的改变。面对人类“前所未有之大变局”,人们需要更具智慧的历史哲学,讲述并书写人类面向未来的终极命运的宏阔故事,以寄托人类温情的价值,安顿人类焦虑的心灵。同时,时代也需要各界携手,一起应对人工智能科技带来的变革与挑战,解决时代的紧迫问题,共建历史的当下与未来。
(作者系北京师范大学历史学院讲师)