张飚:机器能把“青山照水开”送进你的手机时,那时候的神翻译就不再是笑话了

各位朋友们好,我是来自厦大软件学院的张飚,今天我想给大家聊聊我们在自然语言处理方面取得的一些小成就。就在这个20万奖金的鼓励下,我们团队的目标是给机器翻译加点“神韵”,让它们不再是生硬的照本宣科。 说起来挺有意思的,以前机器翻译经常搞出“请在面条外等候”这种让人哭笑不得的神回复。为什么会这样呢?就是因为很多软件都是直接翻译词语,缺乏那种真正的“信达雅”。不过好在现在这个问题正在被咱们慢慢解决。 我今年25岁,是一名研三的学生。今年能拿到百度奖学金全球十强的唯一硕士名额,我觉得特别开心。这个比赛从2013年开始办,到现在为止每年都能吸引上万人报名。今年2017年的比赛更是热闹,最终从40位顶尖选手中挑出了10个人。 你可能会好奇,我们到底是怎么做到的呢?其实就是给编码和解码器这两个大块头做了个“健身”。通过设计全新的循环神经单元,我们用最少的参数和运算量就让浅层系统跑得又快又好。比如说你要是在百度翻译里输入“Water was still, reflecting mountains”,机器现在就不会直接给你硬翻成“水是静止的,映出青山”,而是会给你个“青山照水开”这样的诗句级回应。这六个字里包含了空间、时间和动静的变化,这就是我们追求的那个“雅”字。 除了我之外,其他九名获奖者也来自北大、清华、麻省理工、卡耐基梅隆这些顶尖高校。我们这十人虽然来自不同国度和学校,但心里想的都是一回事——让AI更懂人类语言。 至于这个20万奖金嘛,说实话只是个起点。我们已经把最新的模型开源了,谁都可以拿它来升级自家的翻译引擎;同时我们也在训练多语种模型,希望“信达雅”的翻译能早日覆盖到小语种、方言甚至古诗文。当有一天机器能把“青山照水开”送进你的手机时,那时候的神翻译就不再是笑话了,而是变成了日常的惊喜。 最后想跟大家说一句:水是静止的还是流动的不重要,重要的是它能否映照出青山的模样;人是渺小的还是伟大的不重要,重要的是我们能否用技术让世界变得更美好一点。