问题——智能推荐走进“以旧换新”,为何答案会跑偏? 近年来,智能搜索与内容生成工具逐渐成为公众获取商品信息的重要渠道,尤其手机“以旧换新”等高频、复杂的消费决策中,用户往往希望通过一句话获得“最值得买”的结论;但测试显示,大模型在“选品”场景中并非总能给出稳定、可核验的结果。封面新闻联合天府绛溪实验室在10天内围绕春节消费场景开展测试,借助实验室自研的公域大模型内容生成认知系统,对豆包、Kimi、通义千问三款产品发起超过两万次提问。在“以旧换新换手机”场景中,测试设定四个价格区间,并在24小时内以6至8分钟一次的频率反复提问、汇总对比。结果显示:其一,个别平台出现“信息幻觉”,把并不存在或尚未发布的机型写入推荐名单;其二,不同平台在具体型号和品牌排序上差异显著;其三,尽管推荐机型分化明显,但对主要品牌的“标签式认知”却趋于一致。 原因——训练知识、实时抓取与商业内容交织,放大“传闻权重” 在高端价位段梳理各平台推荐时,豆包曾将一款尚未发布的“iPhone 18 Pro”列为首选。测试提问时间点为2026年春节前夕,该系列远未到正式发布周期,此结论显然与事实不符。继续检索可见,网络上关于有关机型的预测、爆料与概念信息并不少见。天府绛溪实验室先进计算前沿研究中心副主任吴怀谷分析,大模型生成内容通常同时处理两类输入:一类是训练阶段形成的知识结构,另一类是通过实时检索抓取的外部信息,其中可能夹杂营销内容与广告投放。对未发布产品,网络传闻、预测稿、概念图等非确定性内容若在公开互联网中拥有较高传播度与权重,就容易被当作“事实材料”进入生成链条,从而造成“推荐未发布产品”的错误。这暴露出大模型在区分事实与传闻、证据与推测上仍存短板,也提示“来源可信度”与“证据链完整性”将成为智能推荐能否被信任的关键。 影响——推荐结果分化,可能误导消费;但品牌印象趋同,易固化市场认知 对比第三方机构基于销量、热度形成的榜单,三款产品在6000元以上价位段给出的推荐与现实热度存在明显差异。例如,通义千问在该价位段将部分三星机型排在前列,排序甚至超过在权威数据中更靠前的苹果、华为机型;而其他平台则更倾向优先推荐苹果、华为等。专家认为,差异背后与数据源结构有关:不同平台对生态内容的依赖程度、更新频率、抓取范围各不相同;对开放互联网权重较高的信息更敏感,而对相对封闭的讨论场域难以有效覆盖。由此带来的直接影响是,用户若将推荐结果视为“权威结论”,可能在预算较高的换机决策上被误导;品牌与新品若缺少公开互联网中的高权重信源,也更难在智能推荐中“被看见”。 不容忽视的是,尽管机型推荐分歧较大,但三款产品在描述品牌核心特征时呈现高度一致:如华为多与“鸿蒙生态”“自研”相关,苹果常被归纳为“生态闭环”“系统流畅”,OPPO则常被概括为“轻薄”“影像”等。这种趋同反映出海量公开讨论经过长期沉淀,正被模型吸收为相对稳定的“消费共识”。其积极面在于有助于用户快速建立品牌认知框架,但也可能固化刻板印象,使品牌创新亮点难以被及时反映。 对策——提升来源透明与核验能力,构建权威数据入口与行业规则 针对推荐偏差与信息混杂问题,业内建议从三上协同发力:一是平台侧完善事实核验与风险提示机制,对未发布产品、预测信息、缺少权威出处的结论应进行显著标注,必要时降低其推荐权重,并提升对时间敏感信息的校验能力;二是品牌与厂商应建立可被机器识别的权威信息供给体系,通过结构化数据、标准化接口等方式向外部提供经认证的参数、价格、发售节奏与售后政策,减少碎片化抓取带来的误差。吴怀谷指出,建立专属的可验证知识库并被平台有效调用,将有助于提升信息准确度与一致性;三是行业层面可探索形成更清晰的内容标注与数据治理规范,在商业内容、广告投放与客观信息之间设置更透明的边界,减少“看似中立的推荐”被营销策略左右。 前景——智能推荐将更深嵌消费链路,“可信度”将成为竞争高地 随着大模型能力迭代与智能搜索入口普及,未来其影响将从“信息检索”进一步延伸至“消费决策辅助”、售后服务与金融分期等链条环节。可以预见,“回答得快”不再是核心竞争力,“回答可核验、可追溯、可解释”将成为平台能否获得长期信任的决定因素。对消费者来说,面对智能推荐不妨多做交叉验证,把“结论”拆解为“依据”;对平台与企业而言,越早建立权威数据供给与透明标注机制,越能在新一轮信息分发格局中占据主动。
随着算法深入消费决策链条,这次测试不仅揭示技术改进空间,更引发对数字时代信息治理的思考。如何在保证算法效率的同时确保信息真实,平衡商业利益与用户权益,将是智能经济发展必须解决的核心问题。未来智能服务的竞争力,可能取决于其打造“真实信息防火墙”的能力和决心。