刘海涛、隆蝉忆:从细读到远观的数字人文研究转向
数智时代即 “数(据)智(能)时代”,是指在信息技术推动下,人类社会各领域向数字化和智能化深度融合的方向发展。人工智能将重新定义人类知识的边界和我们对现实世界的认知,并在此过程中重新塑造政治和社会结构。在这场不同于以往的“脑力”革命中,人文工作者应该如何融入数字化潮流,为数智时代贡献人文学者的智能?
一
“人文”是以观察、分析及理性批判来讨论人类情感、道德和理智的各门学科和知识的总称。当我们聚焦这项定义时,不难发现人文学科面临的矛盾与挑战,研究者如何确保人文研究的理性和客观?
其实从古至今,人文学科从未中断对“规律”和“模式”的探寻。人文学科与自然科学两者的区别只在于研究对象不同:自然科学探索自然界的奥秘,人文学科研究与人相关的一切。
对于“模式”的探寻实际上是一种对于某个领域知识的探寻,而“模式”实际上就是知识的一种表示方式,自然科学的“模式”反映了“自然界”的规律,人文学科的“模式”反映了“人”的规律,社会科学研究的“模式”则是“社会”的规律。
可见,人文学科并不是与自然科学截然不同、相背而行的领域,而是与之并行的智力活动,两者并无本质差异,同样追求对其研究对象深层次的理解和解释,发现纷杂多样的现象背后的秘密,寻找所研究系统的模式与知识。
智能时代的推动力源于数据,我们需要重新审视人文研究的根本任务和研究范式,从根本上思考过去知识获得与表征方法的有效性,以及这些方法是否反映了人类“软件”运作的真实情况。
传统人文偏向采用所谓“细读”的文学批评方法对小规模文本进行深入详细的分析,通过逐字逐句阅读来对文本进行详细、彻底的解释。然而,获取数据在数智时代已不是难事,人文工作者想要在海量数据中发现规律和模式,只依靠“细读”是不够的。
21世纪初,弗朗科·莫雷蒂提出 “远读”方法,即通过聚合和分析大量数据来理解文学,而非止步于研读特定文本。沿着舍弃阅读文本的角度来看,“远读”更精确地说应该是“远观”。
数字人文的核心在于如何将数字(数据)与知识、社会、文化、历史、人联系在一起,不能满足于把一本书、一幅画保存在计算机里,而是要努力从“细读”走向“远观”。
从大量文本中发现趋势、模式等通过普通阅读难以发现的现象,从而更科学地发现、解释人类行为的模式以及人与社会、自然交互的规律,更准确地预测人类社会的未来。
数字人文将“可操作、可重复、可传授”的科学方法应用到人文研究领域,人文研究的解释力和预测力得以提高,也有助于缓解长久以来人文领域难以进行有组织科研的局面。
然而数智时代的海量数据并不能保证发现规律,我们需要思考如何在数据基础上进行更加科学的解释,以及如何利用数据发现人文规律。
智能的本质是适应不断变化的环境的能力,这种能力体现在获取知识并运用这些知识解决问题的过程中,而模式是构建人类知识体系的基本要素。我们理解世界、学习新事物、解决问题,都依赖于识别和应用各种模式。模式是构成人类知识体系的要素。
数智时代的到来,使人类有可能回归到没有学科细分的时代,创造了对“模式”进行更好的探索的新窗口。那么,如何从人文数字(据)中更快捷地发现我们需要的“模式”呢?
二
发现模式是人文学的根本任务,而“远距离”更易发现模式,“可视化”是发现模式的利器。计算工具能以一种直观的、便于分析和理解的方式来呈现这些数据,而“可视化”能够使庞大复杂的数据关系和模式变得直观易懂,通过图形、图表等形式更直观地展示数据,趋势、集群和异常点等一目了然,帮助我们发现过去难以发现的规律和模式。
规律性是所有科学研究的核心。通过规律,我们可以解释和预测特定的模式。通过大数据分析,我们能够揭示文学作品中的模式,并发现其中的数学定律,如著名的“齐普夫定律”。
尽管文学被视为表达自由度最高的方式之一,也同样受到齐普夫定律的支配。通过“数据—模式—定律—解释—预测”这条科学研究链,齐普夫定律完美地展现了数据驱动知识发现的魅力。
数据和可视化的透镜能显著提升我们对人文学科诸多领域内规律和模式的发现效率与理解深度,而且由于所用的研究材料与大语言模型是同源的,所以所得到的结果,更容易解释和预测大模型的行为。
值得强调的是,数字人文的本质在于“远观”,众多研究案例表明,只要拥有适宜的“望远镜”,任何人都能够“远观”世界。
新时代的智能是由数据催生的智能,这意味着数据和智能之间具有密切的关系。了解这种关系,并对数据产生智能的过程进行逆向工程,将是未来科学家面临的挑战和机遇,对专门研究人类“软件”的人文学者而言,则更是如此。
因此,人文学科的发展必须适应智能时代的召唤,数字人文是人类展现自身智能和破解智能之谜千年难遇的机会。
【作者简介】
刘海涛,浙江大学外国语学院求是特聘教授。主要研究方向为:计量语言学和数字人文、计算认知科学、依存语法和配价理论、语言规划与语言政策、国际语语言学和世界语学。
隆蝉忆,浙江大学外国语学院博士研究生。
(来源:原文载于《当代修辞学》2024年第3期,题为《从细读到远观:数智时代人文研究的新路向》。)