把握机遇,迎接挑战——“信息时代的语言研究”学术研讨会顺利举行
2017年4月22日上午,“信息时代的语言研究”学术研讨会在浙江大学之江校区小礼堂举行。本次研讨会的召集人是浙江大学求是特聘教授刘海涛。来自清华大学、武汉大学等国内二十余所高校的专家学者以及百余名语言研究爱好者,齐聚小礼堂。浙江大学社会科学研究院院长何莲珍教授、副院长胡铭教授出席了本次研讨会。研讨会由浙江大学外语学院梁君英教授主持。研讨会气氛热烈、讲解精彩、探讨深入,堪称一场学术盛宴。
浙江大学之江校区小礼堂
研讨会伊始,刘海涛教授为大家带来了题为“信息时代的语言研究:问题、挑战、变革、机遇”的报告。刘教授首先指出,信息时代的语言研究正面临严峻挑战。机器翻译、自然语言处理、人工智能等基于大数据的语言技术近些年来取得了卓越成就,但语言学家在其中发挥的作用却非常有限;自然语言处理专家耶里年科(Jelinek)曾经直言不讳地指出:“每当我解雇一个语言学家,语音识别系统的性能就会改善一些”。这值得每一位身处信息时代的语言研究者深思。
面对新时代的挑战,刘海涛教授指出,语言研究的对象和方法可能都要发生转变,以此才能将挑战转化为机遇。2016年,世界语著名语言学家、词汇功能语法的创始人布里斯南(Bresnan)在获得国际计算语言学协会(ACL)终身成就奖的颁奖典礼上,发表了题为“语言学:花园与灌木丛”的演讲,讲述了她自己从花园到灌木丛的转变历程。她以“花园”里的花朵比喻内省式语言研究所关注的、少量的人造话语,而以“灌木丛”比喻自然语境中大量的真实话语。刘教授借此指出,语言研究需要立足于现实生活中的真实语句,通过统计的方法,寻找真实语言的规律以及这些规律背后更深层次的机制。这样的语言学研究不但可以更好地揭示语言的真实面貌,也可为应用研究提供所需的学科支持。
刘海涛强调语言是由人驱动的复杂适应系统。语言的结构模式和演化规律均受到生理、心理、认知等内部因素,以及自然、社会等外部因素的综合影响。其中,内部因素的普遍性决定了语言的共性,外部因素的差异造就了语言的多样性。随后,刘教授围绕这两点简要介绍了其团队基于依存句法标注语料库所做的部分工作。例如,刘教授的团队首次发现在数十种自然语言中均存在依存距离最小化现象,并指出这可能是人类语言的普遍规律,由人的普遍认知机制所推动,对自然语言的结构模式具有广泛深远的影响。他们也首次用依存方向作为计量指标,解决了词序相对固定语言的类型学分类问题;对于词序相对自由的语言,刘教授团队则通过语言复杂网络研究,较好地解决其类型学分类问题。这些研究充分说明,在当今信息时代,真实语言大数据以及计量方法对于科学化的语言学研究具有重要的意义。值得一提的是,刘教授团队所使用的语言资源大多来自计算语言学领域,这种同源性使得语言规律的发现与语言处理应用的结合更加紧密。
刘教授的报告深入浅出、发人深省,不仅指出了信息时代语言研究面临的挑战,也以其团队的一些具有开创性的研究为例给大家提供了值得借鉴的思路。梁君英教授在小结中指出,刘海涛教授的讲座为我们描绘了语言学研究的一颗参天大树,即基于大量数据发现语言的普遍规律,从而反映人类的普遍认知规律,最后服务于现代社会的科技创新。胡铭教授对刘教授的报告表示赞同,他指出,重视真实数据在人文社科的各个学科研究中具有普遍的重要意义。
刘海涛教授的报告为本次研讨会做出了精彩的引导。随后,12名嘉宾分为两组分别登台畅谈对信息时代语言研究的看法和期待。由6名中青年学者组成的“青年组”围绕“语言研究在信息时代应该采取怎样的新思路和新方法”这一话题展开,各位嘉宾都结合自身研究方向给出了各自的见解。
清华大学封宗信教授指出,在大数据时代,语言研究需要拓宽视野。语言学研究有理想和现实两个层面。理想层面是虚拟层面,许多语言学家做的是哲学思辨和逻辑推理,他们采用的语料符合本族人的直觉,但未必是语言的实际使用。现实层面的研究,需要语言研究者处理真实的语料,用科学手段和现代技术进行描写和分析,得出的结论更为可靠,更能说明语言使用的本质。结合自己从事的文体学和认知诗学研究,他指出,超句子语言单位,也就是话语或语篇或篇章,其中一些东西是以句法为对象的语言学家难以解释的。基于大数据的量化语言学研究,有客观性、系统性和一致性,能科学地揭示常人不易看到或常规手段没法发现的事实和规律,但未必所有人都愿意接受。在人文和科学之间找到一个契合点或平衡点,需要人文学者和科学家共同努力,但语言科学家的贡献更重要。
武汉大学冯学锋教授说,语言学家在信息时代遭遇的挑战远大于机遇,需要大家具有极强的忧患意识。冯教授从社会语言学研究角度提出了自己的看法:信息时代的海量数据与信息传播速度极快这两个特点,要求语言研究要懂得利用有效的方法筛选信息,为语言研究所用。他以“分享”一词为例,介绍了该词语义的变化和由社会经济文化发展导致的这个词的使用频率的起伏。他指出,网络用语的研究前景很大,可以以问题为导向,在信息时代积极开拓研究思路。
曲阜师范大学李德高教授表示,在信息时代,语言学家并非无用武之地。他结合自己所做的语义网络字词研究,介绍了如何让信息技术更好地服务于研究目的。谈起信息时代,李教授感慨,如今计算机与网络的发达程度为学术研究提供了极大的便利,鼓励各位学者灵活运用各种海量资源,使研究更进一步。
中国社会科学院语言研究所王伟副研究员从宏观的视角阐述了自己的看法。他指出,语言本体研究探究语言的基础规律,应用研究运用本体研究的成果更好地服务我们的生活。但在目前,本该联系紧密的本体研究和应用研究却严重脱节。这是因为所谓的本体研究并无法给应用研究提供可靠的成果。以自然语言处理为例,工业界在现有的语言学研究成果不能满足实际应用需求的情况下,只能另辟蹊径。这为语言学的本体研究敲响了警钟。信息时代的语言学研究应以系统的、科学的、实证的方式展开,为应用研究提供必需的、可应用的发现。同时他还指出,要重视理工科思维方式与研究方法在语言学人才培养中的重要作用。
西安交通大学王敏教授说,二语习得领域的研究在学科建立初期有两个显著特征,一是寻找学科模式,狂热追逐因果关系,二是试图解释语言的复杂性与人类认知有限性之间不可调和的矛盾。基于这两个特点,习得研究将研究对象简化为零散的句子,以求寻找精致的规律。但随着学科的发展,该领域的专家学者逐渐认识到这样的研究没有现实意义。因此,习得研究正在发生着转向,更多地关注语言的复杂性、多样性和心理现实性。信息时代正好给了习得研究一个很好的契机,王敏教授认为语言研究方法在新时代已经有所突破,语言研究前景广阔。
中国传媒大学于水源教授在简要回顾自然语言处理领域的规则派与统计派的发展历程的基础上指出,随着隐马尔可夫模型、人工智能、深度学习等技术的引入,自然语言处理目前更偏向统计方法。但这并不意味着这个时代已经不再需要语言学家。在现有的自然语言处理模型中,人们只了解到需要哪些参数,但这些参数的语言学意义亟待语言学家进行探究。同时,自然语言处理技术的发展也为语言学研究提供了可借鉴的方法和新的研究问题。
紧接着,6名75后、80后学者组成“少年组”,以问答的形式对颇具争议的一个问题进行了讨论:有些人认为大数据重相关、轻因果,我们应该如何理解相关和因果的关系?宁波大学尹军副教授说,如果研发出合适的算法,人们是可以通过数据从相关关系推出因果关系的。另一方面,从本质上讲,因果关系是一种理论的构建,并不能从数据直接得出,但大数据的存在减少了现象的变异性,为系统化的解释、推导提供助力。华中科技大学雷蕾教授认为,相关关系和因果关系在不同的学科侧重不同。在工科、商业领域,或许相关关系足以保证人们做出正确的决定。但在语言学领域,我们的研究需要对现象进行解释,探索内在的规律。内蒙古大学达胡白乙拉教授指出,民族语言学的研究在信息时代面临的挑战更大,少数民族语言的数据资源较为贫乏,目前难以利用大数据研究范式去考察相关、寻求因果,需要在数据积累方面多下功夫。广东外语外贸大学任伟教授认为,计算机技术的发展为我们进行语言研究提供了存储和计算两方面的便利,一方面可以积累数据,另一方面便于追寻规律。但在实际层面,任教授认为研究的导向受到大数据容量的影响,如果所谓的“大数据”足够大,那么相关关系就是因果关系。浙江大学丁鼐教授从理工科角度解释了这一问题。他指出,学术研究存在不同的模型,描述模型用于预测趋势,需要的是相关性;而原理类模型则是要探究原因,需要因果关系,具体情况需要通过具体的模型进行判断。北京语言大学黄伟副研究员认为,这一争议出现的原因之一是我们在信息时代拥有了收集与处理大量数据的能力。就语言学而言,不能抛弃因果,要从问题出发,收集大量的数据,从中去探究语言规律。
随后6位“少年组”学者还分享了各自认为在信息时代值得深入研究的一些方向。达胡白乙拉教授指出,要将计量研究方法用于蒙古语研究,尤其需要以大数据驱动的方法解决蒙古语学界存在争议的问题。任伟教授提出一小一大两个目标,首先希望运用更大量的数据研究语用现象,更高的目标是探究如何教会算法解决最初级的语言现象。雷蕾教授表示自己比较关注语言历时的变化,而且这一问题可以通过分析更大量的数据进行探究;为此,需要在人才培养方面重视学生数学、编程能力的提升。丁鼐教授关注从心理学角度探究语言问题,具体而言,他希望探究语言加工过程中工作记忆的工作机制。尹军副教授指出,人脑本身就是一个精密、强大的信息处理系统,他希望探究人类的信息输出,即语言如何在心理层面进行映射。黄伟副研究员表示,语言研究的走向和研究方法的选择是基于语言观的,即如何对语言研究进行定位。在信息时代,语言研究如果被视为一种信息世界的基础研究,则需要更多地采用实验、统计方法去发现与验证语言规律。
最后,梁君英教授在总结发言中指出,研讨会对我们每一位学习者、研究者都有很好的启发与鼓舞作用,我们每一位都应该拥抱信息时代,学会使用新的科学方法,同时结合个体的研究目标与兴趣,致力于发现语言普遍规律、揭示人类认知规律,从而提升自己的学术能力,推进语言学研究的科学化与国际化。
(新闻撰稿人:刘益光)