新闻 资讯 金融 知识 财经 理财 科技 金融 经济 产品 系统 连接 科技 聚焦
首页 > 金融 > > 正文

南桥|对人工智能改进机器翻译的效果,我持乐观态度

2021-04-25 01:45:50来源:互联网

已经公版的作品,由于无需支付版权转让费,一时间百舸争流,多的甚至出现几十种不同的译本。《瓦尔登湖》就是一例。

1933年,亚美尼亚裔法国工程师乔治·阿特斯鲁尼(George Artsruni)获得了“机械大脑”的证书专利。这个机械大脑是用目标语言中的单词,替换原始语言中的单词,类似于今日Word的替换功能。这应该是机器翻译的较早记录。

后来,机器翻译和计算机的发展并驾齐驱。冷战期间机器翻译达到了一个小高潮。美苏两大阵营,都存在大量译介对方情报之需。当时东西方交流少,翻译需求大,但人工昂贵。在1963-1965年间,美国政府花在翻译上的钱是1300万美元。翻译费用标准在千字9美元到66美元之间,比21世纪中国文学翻译的标准还高出很多。1964年,美国成立了自动语言处理咨询委员会(ALPAC),邀请了来自贝尔实验室、兰德公司、哈佛大学、芝加哥大学、康奈尔大学等机构的专家,分析机器翻译的未来,为美国国防部、中央情报局和国家科学基金会等机构提供决策参考。

很长时间以来,研究者对机器翻译还有一种思路,类似于柏拉图的现实乃理念之模仿一说:所有文本,如中文、英文,都是更为抽象的某个超级文本的解码。如果能回到这个抽象的超级文本上,再译成具体的语言就不难了。这种理念化的文本,也反映人类对于思维逻辑性和规律的追寻。这一思路在理论上很美。有一种堪比巴别塔语言的世界语在理论上也很美。但它们都忽略了人类语言的复杂、模糊、灵活,和根植于具体环境的借景生意。这些因素,造成了人和机器的关系千变万化。

现在的机器翻译核心处是人工智能。人工智能不只是在找语言规律,而也依靠日渐扩大的语料库。机器翻译可以使用统计学的规律,寻找语料之间最为可能的对应。谷歌近些年提出了一个“神经机器翻译”(Neural Machine Translation)的说法,试图摆脱词汇、术语、句子之间的简单对应,而是试图在两种语言之间,寻找合适的对应,并实时矫正。机器自己在开展深度学习,不断纠正自己的错误。这样一来,文字翻译的准确性会逐渐提高。对人工智能改进机器翻译的效果,我持乐观态度。

在机器和人之间,最好的办法,是让机器做机器擅长的事,让人做人擅长的事情。人工智能对于翻译来说,是一种强大的赋能,而非狡诈的竞争。在文学翻译领域,受工匠思维的影响,作品被说成像机器翻译一度是见不得人的事。一句“机翻”的评论,能引发豆瓣上的一场一星运动的腥风血雨。好在此争论也没白费,好歹让人们更为合理地考虑机器翻译的角色与定位。

在角色上,人类翻译能游走于上述复杂、模糊、灵活和情景之间,在理解的峰顶和夹缝之间,找到自己的活路。文学翻译不妨利用机器的力量,完成初始的翻译,然后再来动手,会节约大量人工。节约的时间来自专业术语的统一,人名地名的翻译。中外文的对照翻译,放在同一个平台之下,也会使得重复性词语、术语翻译的修改更为简便。不然的话,两套文本在不同体系之下,查到原文的查不到译文,查到译文的查不到原文,无法一一对应,无法一网打尽。

人和机器翻译谁优谁劣是个伪命题。机器不是有情感的主体。机器没有和人类较劲的必要,人类也没有与机器较劲的必要。能利用机器翻译提高自己的效率和效果,才是明智的做法。那种阿尔法围棋和人类高手对决的场面,不应出现在翻译领域。文无第一,译无第一, 只有不同的方式的失手,和相得益彰的补充。对于人类翻译来说,机器翻译就好比苹果的Siri, 百度的“小度”,都是我们的人工助理而已。

更值得我们思考的,不是“翻得怎样”,而是“翻译什么”的问题。过去,翻译的文本,直接会影响一个人甚至一个国家的命运。可以想象,如果《圣经》《资本论》《天演论》这些文本没有翻译,结果会是怎样?

需要说明的是,不是所有的翻译都是有益的。在文学领域,美国翻译得很少,中国则为翻译第一大国,什么作品都翻译。已经公版的作品,由于无需支付版权转让费,一时间百舸争流,多的甚至出现几十种不同的译本。《瓦尔登湖》就是一例。比较不同的版本,都可以产生一门“瓦学”来,有这必要吗?真正重要的文献,尤其是对于我们对一个领域深入了解的学术文献,对于大众生活会有显著改进的文献,翻译又是匮乏的。

在文学界,中国出版界引进国外新书速度很快,新品泛滥。一有国外文学奖颁布,立刻就被抢购一空。让翻译做完之后出版,没有一炮打响,也不想持续经营,赶紧去追下一本,把现有的书丢掉不管。这些做法,多属狗熊掰玉米,一路走一路丢。这种货大量足式的大批量引进,跟文学翻译太廉价,没多少成本也有关系。指望译者用爱发电,做大他们的“码洋”,是荒唐的。缺乏行业的组织协调,译者起码可以给自己设个标准,把生存和生活的改进放在第一位,不要被各种情怀的说辞所误,尽量少做一点。不过当我提出这个想法时,南京大学英文系教授但汉松教授的回应是:“不太可能的,以后译者议价能力会越来越低——因为一些高校对教师和研究生的译作开始计入科研分数或毕业发表(譬如两本译著折算为一篇c刊),只会有更多的人愿意成为廉价劳动力。”但教授说的是有道理的,把优秀的翻译不当学术成果,是遗憾的。如果算成果,也要小心人类的指挥棒效应:你去衡量什么,就会得到什么。当我们讨论翻译未来的时候,不妨考虑什么样的翻译,能够改进人本身的生活质量,而不是让人成为廉价劳动力。

机器翻译可以拓展我们的专业视野。在诸多小众领域,翻译的书或其他资料,可能看到人不多,出版社也不愿意做。外语水平欠佳的人又看不到,视野受到限制,不妨利用更多机器翻译,翻个大概:内行人有时候需要的精度也不是很高,如果机器翻译不断改进,准确性提高到八九十分,很多人工翻译是不需要的,凭借机器翻译即可。一些科技文献,业内人士借助机器粗翻的结果,结合自己的专业知识,可以了解大体情况。一些仅需了解的说明文字,机翻完全够用。

机器翻译可以改进普通人的生活。保健、教育、亲子关系、冲突处理、有效沟通等方面,有很多实用的资料,翻译出来会影响一个人人发展的轨迹,甚至改变一个家庭的命运。又有多少出版社在争先恐后去翻它们?如果能够借助机器翻译的力量翻译出来,也是大有功劳的事。在国际争霸期间,机器翻译是刺探对方情报的手段。如今,我希望机器翻译成为改进人类生活的利器。

南桥

关键词: 南桥 人工智能 改进 机器翻译

热点