网易有道把行业首个同传agent给推了出来,ai 终于把从“养虾”里头做的事加速用到了真工作

网易有道把行业首个同传Agent给推了出来,AI终于把从“养虾”里头做的事加速用到了真工作中。最近AI圈里头“养虾”火得不行,这种Agent的概念也就在各种垂直的应用里头扎了根。先是开源了国内第一个“龙虾”,网易有道这次更是抢先一步,拿出了行业里第一个同传Agent,还给它加上了录音转写功能,想靠着这股力量把课堂还有会议里头信息处理的效率给变快一点。 最近,一个叫OpenClaw的开源项目带火了AI界的“养虾”热,大家看重的其实就是AI的交互方式从过去那种一问一答的简单模式,变成了能听懂复杂意思、自己盘算怎么去干活的Agent。这种变化也悄悄地出现在了实时翻译和语音转写这种大家平时老碰到的事情里头。不管是在上课、开讲座还是跨国开会的时候,用户脑子里装的东西太多了:既要听懂外语讲的啥,又得把这意思翻译出来,还得顺手把重点给记下来——“上课全靠录音笔回放两遍”“听英文讲座的时候想记笔记和想听懂总是打架”……这些实实在在的难处,老的翻译工具根本没法解决。有道这次推的行业第一个同传Agent,正是把这一点给找准了路子。 据了解,用户只要在有道词典或者有道翻译的首页点一下“同传”,这个Agent就能自动把一整套流程给干了:先把现场的声音听进去——实时把原文记下来或者翻成目标语言——同步生成带时间戳的内容,还能让用户随时补笔、拍PPT的图片——等说完了,同传Agent还会根据不同的场子凑生成总结报告,比如课堂知识点、会议纪要或者思维导图啥的,帮着用户赶紧把信息的脉络捋清楚。这就意味着大家不用再在“听讲”跟“记录”之间来回切换注意力了,可以把更多的心思放在理解内容本身上去。 这一套这么顺手的体验背后,靠的是有道攒下的硬功夫。为了能在那种又杂又乱的真实场景里稳定发挥作用,这个Agent在听得多广、听得多准还有在啥样的复杂环境里都能用得上这几方面一直在使劲儿优化。现在这个功能已经支持71种语言、125种口音的实时识别了,不光把那些主流的通用语言全包了,连粤语、印度英语这些挺有特色的口音也都收进来了。系统还用了远场语音识别的技术,哪怕在大教室或者会议厅这种吵吵嚷嚷的地方也能稳得住效果。 另外系统还专门找了经济、物理、计算机、数学、医学这些专业的资料去练了一练,好把那些专业术语给认准了、翻好了。这样它就能更好地应付学术课或者专业讲座这种复杂的使用场景了,准确率能飙到98%。说实话这也不是有道头一回在Agent这块儿试手了。从那次业内大讨论的“百虾大战”里头LobsterAI(有道龙虾)成了国内大厂头一个开源的龙虾开始,到这次弄出了行业第一个同传Agent,网易有道正以前所未有的速度把Agent往实际的工作里头推。等AI开始把处理信息的那些杂活儿给全包了,那种光图效率的工具模样也就被重塑了。