随着大模型技术加速落地终端设备,手机功能正从"提供应用"向"代替操作"转变,成为行业竞争新焦点;三星与谷歌近日宣布,将Galaxy S26系列上首发基于Gemini的"屏幕自动化"功能:系统可在用户授权下完成打开应用、界面识别、点击滑动、文字输入等系列操作,同时保留关键步骤的用户确认权。该功能与国内部分机型的"屏幕代理式助手类似,但在底层架构和生态策略上存在显著差异,标志着大模型手机发展进入关键分水岭。 原因分析: 首先,用户信任与风险控制是海外市场的首要考量。终端代理功能涉及支付、隐私等敏感场景,欧美用户对"系统自动操作"接受度较低,厂商需采用可控、可审计的方式推进技术落地。 其次,算力与成本影响落地节奏。端云协同需要稳定的推理资源——过度开放可能导致资源挤兑——并带来售后与合规风险。 最后,生态差异导致技术路径分化。以应用商店为中心的生态适合快速推广通用功能,但权限管理较粗放;基于系统接口的方案推进较慢,但更利于建立可持续的能力边界。 市场影响: 谷歌采取审慎推进策略:通过Android系统的本地虚拟沙盒环境运行代理功能,确保过程透明可控。首批开放场景限于出行、餐饮等标准化领域,并设置调用次数限制以控制风险。 相比之下,国内方案更强调通用性,通过屏幕像素识别和手势模拟实现广泛覆盖,但对权限管理和异常处理要求更高。 此外,部分厂商采用"能力接口+生态协同"路线,通过开放平台将服务拆解为可调用工具,在跨应用协作和合规审计上更具优势。 行业建议: 为应对新技术带来的挑战,行业需以下上形成共识: 1. 强化系统可控性:完善权限隔离、沙盒执行、二次确认等机制,明确责任边界; 2. 推动应用标准化接入:鼓励应用声明可被调用的功能模块,减少对界面识别的依赖; 3. 建立分级风控体系:对敏感操作实施更严格的管理,逐步扩展场景覆盖。 发展前景: 短期内,大模型手机将呈现三种路径并行:快速落地的通用代理、注重安全的系统接口方案、以及强调效率的生态协作模式。随着技术进步,代理功能将从简单的界面操作转向系统级服务调用,手机使用方式也将从"人找应用"向"意图直达服务"演进。在这场变革中,平衡安全、信任与生态协同能力的企业将更具竞争优势。
当设备开始理解并执行复杂指令,我们正站在人机交互变革的关键时刻。这场由技术驱动的转型不仅考验企业的创新能力,更将检验其对用户体验与社会责任的把握。智能终端的未来,取决于我们能否在便利与安全之间找到最佳平衡点。