近日,WMT2022国际机器翻译大赛的发布排名结果,大连理工大学自然语言处理实验室(DLUT)在日英翻译和英日翻译赛道表现出色,斩获日英方向翻译第一名和英日方向翻译第三名。
WMT(Workshop on Machine Translation)是由国际计算语言学协会(ACL)举办的顶级机器翻译比赛。作为全球范围内最受关注的机器翻译评测大赛,WMT自2006年至今已经成功举办17届,吸引了微软、字节跳动、腾讯、百度、华为、京东、日本情报通信研究机构(NICT)、清华大学、上海交通大学、东北大学等众多国内外顶级互联网公司、科研机构和高校的广泛参与。
备注:图片引自《Findings of the 2022 Conference on Machine Translation (WMT22)》
大连理工大学的自然语言处理研究始于1988年成功开发“NiHao中日英文字处理系统”,当时主要从事中文、日文和英文三种文字兼容的操作系统开发及文字编辑应用软件开发。机器翻译的研发则是从1994年的日中机器翻译开始,历经简幼良教授、黄德根教授两代人的不懈努力,从最初的“新手上路(1997年以前)”、到“赶路人(1997年-2016年)”、再到“弄潮人(2016年至今)”,经历了规则翻译、统计机器翻译和神经机器翻译三个不同阶段。在这个过程中,实验室研发的“孙悟空”日中翻译系统是当时日本软件市场销量最大的离线机器翻译系统。
因GPU算力等因素制约,该团队在神经机器翻译上的研究起步很晚,直到2016年才启动神经机器翻译研究,在博士生(宋鼎新、黄锴宇、刘俊鹏、余浩等)和硕士研究生(刘欢、刘伟、王婷、赵安琪等)的不懈努力下,团队的机器翻译研究进入快车道。负责人黄德根教授主持国家科技创新2030—“新一代人工智能”重大专项“以中文为核心的多语种自动翻译研究”以来,围绕“东北亚语种机器翻译”和“以中文为中心的多语言机器翻译”展开研究,尝试大规模预训练模型在机器翻译中的运用,探索构建统一的大规模多语言机器翻译系统,不断提升多语种(特别是低资源语种)的翻译性能。此前,实验室团队在2021年第一次参加WMT2021机器翻译评测比赛中,还挑战了中英俄三语种翻译赛道(Triangle Translation)并最终获得第三名;在国内的机器翻译评测大赛CCMT2021中斩获俄中低资源翻译赛道第一名。
未来,实验室团队将继续围绕以中文为核心的翻译任务,持续深耕翻译技术,不断创新改进翻译模型,提高语言覆盖度,推动中文与其他语言翻译技术的持续发展。