科学研究离不开对现有文献的准确把握;然而,全球科研论文数量激增,研究人员面临巨大的信息处理压力。传统文献综述方法难以应对该挑战,而现有的大语言模型虽然方便,却存在严重的准确性问题。数据显示,GPT-4o在文献引用中出现幻觉的概率高达78%至90%,这不仅让研究人员耗费大量时间甄别错误引文,还可能误导研究方向,严重影响科研效率。
从"能写"到"可信",是科研辅助工具成熟的关键跨越;准确的引文和可追溯的来源影响着学术创新的效率和质量。开源模型与公开基准的结合为改进自动化文献综述提供了可验证的路径,同时也提醒我们:技术可以减轻负担,但不能取代学术判断和责任。只有在透明、可验证的框架下优化,工具才能真正服务于科学发现。