问题——车载语音长期“好用不爱用”。
在智能座舱快速普及的背景下,车载语音曾被视为提升安全与便利的重要入口,但现实体验常被诟病:识别与理解脱节、反馈机械、对话断续、等待时间长,尤其在复杂噪声、多人对话、情绪表达等真实场景下更易“失灵”。
当车企纷纷把座舱当作“第三生活空间”来打造时,如何让人机交流从“指令式控制”迈向“自然式沟通”,成为行业绕不开的关键题。
原因——技术路径与工程约束共同制约体验。
业内普遍采用的链式语音方案往往由“识别—理解—合成”多个环节串联完成,链路越长,信息损耗与误差累积风险越高,带来的直接结果是:语义把握不稳、情感表达不足、交互节奏不自然。
同时,车载环境对算力、能耗、网络、车规可靠性提出更严苛要求,既要“像人一样会说”,又要“像车一样稳定”,这使得语音系统不仅是算法问题,更是软硬件协同与工程落地能力的综合考验。
影响——交互范式变化正在重塑产品竞争维度。
此次CES现场,吉利银河M9展示的语音交互强调“对话感”和“共情力”,并将快速响应作为核心指标之一。
测试数据显示,相关模型端到端链路首音时延可控制在0.7秒以内,接近实时对话节奏。
观众对“更像人与人交流”的评价,反映出海外用户对座舱体验的关注点正在从功能堆叠转向交互质量:不仅要听得懂,还要答得对、接得住话、跟得上情绪变化,并能结合场景主动提供更舒适的座舱服务。
与此同时,支持自定义音色、语速与风格切换等能力,使座舱从标准化工具进一步向个性化空间演进。
对策——以端到端能力为牵引,补齐“数据—工程—生态”三环。
行业观察认为,要让语音交互从演示走向规模化体验,需要多方在三方面持续发力:一是夯实高质量、多场景的数据与评测体系,覆盖噪声环境、方言口音、多人对话、情绪表达等高频车内场景,以可量化指标推动体验进步;二是强化车规级工程化落地,围绕时延、稳定性、离线能力、隐私保护与安全机制进行系统设计,避免“实验室效果”与“上车体验”脱节;三是推动座舱生态协同,打通导航、空调、音乐、座椅等功能与服务,形成可持续迭代的交互闭环,使“会聊天”转化为“能办事、办成事”。
前景——“大模型上车”将从卖点走向底座,体验上限决定竞争上限。
业内人士指出,银河M9在国内市场形成口碑后走向国际展会舞台,体现出中国汽车产业正在从以往的“配置竞争”转向以体验为核心的“交互领先”。
随着座舱从信息娱乐中心升级为智能服务中枢,语音作为最自然的交互入口,其能力上限将深刻影响品牌形象与用户黏性。
未来一段时期,能够在低时延、高稳定、强理解、可个性化等方面形成体系化优势的车企,更可能在全球市场建立差异化竞争力。
吉利银河M9在全球舞台上的成功展示,不仅是一款产品的技术突破,更是中国汽车工业发展阶段的重要体现。
从被动跟随到主动引领,从硬件竞争到软件生态,中国汽车产业正在实现深层次的转型升级。
未来十年,智能座舱大模型技术的演进将深刻影响汽车产业格局,而率先掌握这一技术的企业,必将在全球竞争中占据战略优势。
这一进展也启示我们,自主创新与产业应用的结合,是推动中国制造向中国创造转变的必由之路。