人工智能的速度,可能会让大脑更快地掌握技能

从我们现在掌握的情况来看,大脑可能从那些不太常发生的事儿里学的东西,比老一套的重复操作多得多。为了研究这个,科学家们拿多巴胺来测量小鼠神经纤维的排布情况。Nature Neuroscience 上刊登了这项成果。大家都记得吧,一百多年前,巴甫洛夫(Pavlov)用铃声把狗给训练得能把铃铛声和食物联系起来。从那以后,大伙儿都觉得学习就是个反复练的过程:只要铃声响了能吃到东西,次数越多,狗就记得越牢。不过加州大学旧金山分校(UC San Francisco)的一帮人正试着推翻这个老观念。他们给出了新想法:学得好不好,关键不在干了多少回,而在你等奖励这段时间有多长。“这表明,提示跟奖励中间的这段空当,能帮大脑定调这趟经历能留下多少印象,”神经病学副教授 Vijay Mohan K. Namboodiri 博士说。“要是事情来得太紧凑,大脑在单次体验里吸取的养分就少,”他接着讲,“这或许也能说明为啥平时磨磨蹭蹭的学生比不上全年死磕的人。” 以前的科学家把联想学习当成是试错的过程。一旦大脑觉得某个信号能带来甜头,就会开始去猜这甜头啥时候到。大伙儿以为一开始只有真正拿到好吃的东西时才会有多巴胺涌出。可要是甜头来的太频繁了,大脑收到信号就会先冲动一把预支多巴胺来预测甜头。这种多巴胺的“击中”其实是在帮大脑把预测给搞精准些,理儿是说要是真来了甜头就能强化信号和甜头的联系(要是没来甜头就削弱)。 Namboodiri 和博士后研究员 Dennis Burke 在实验室里让小鼠把短暂的声音跟糖水挂上钩。他们试着摆弄了一下两次实验之间的间隔时间。他们给一组小鼠把试验间隔定在了 30 到 60 秒之间,另一组则拖得更久些——5 到 10 分钟或者更长。结果发现,那些试验间隔近的小鼠显然拿到了更多的奖励——在相同的时间总量里它们确实是更多的赢家。如果按照以前的“熟能生巧”论来说,做实验多的应该学得更快才对。但事实是拿到很少奖励的小鼠和那些做了 20 倍数量试验却拿得更少奖励的家伙学得一样多。“这说明现在的‘多练’已经过时了,真正说了算的还是时机,” Burke 说。 Burke 和 Namboodiri 又去琢磨了多巴胺在小鼠脑子里的作用情况。要是奖励之间隔得久一点,小鼠在听到提示的时候只要重复的次数稍微少一点就能开始分泌多巴胺了。 接着他们又换了个玩法来测试这种现象是否真的适用。他们把声音反复播放——每次间隔 60 秒——但只在 10% 的测试回合里给糖水喝。不管提示出来后有没有糖水跟着来,这些小鼠在听到提示后分泌多巴胺需要的回合数都大大减少了。 这种快速学习的苗头可能会给我们认识学习和成瘾的方式带来些改变。比如说抽烟这事儿通常是断断续续的,闻到烟味或者看见烟卷往往就会勾起想抽的欲望;而尼古丁贴片是不停地给身体输送尼古丁的药物,这种持续的供应可能会扰乱大脑里尼古丁和多巴胺奖励之间的联系机制,从而抑制住抽烟的冲动帮人戒烟。 下一步呢?Namboodiri 打算研究一下他的新理论能不能用来加快人工智能的速度。现在的 AI 系统学得特别慢的原因在于它们都是按照旧有的联想学习模型来运作的,得摆弄上几十亿个数据点才敢做一点点微调动作。“借用我们发现的这个模型设计思路的话,AI 完全有机会从更少的经历当中更快地掌握技能,” Namboodiri 说,“不过眼下咱们人脑在学习速度上可是甩机器好几条街呢。” 这次文章的信息是慧从论文"Duration between rewards controls the rate of behavioral and dopaminergic learning"那里摘编过来的。这篇文章发表在Nature Neuroscience 2026年那一期上的相关信息里的;文中没有特别注明出处的配图通常来自网络公开图库或者咱们自己动手画的。 这里只是单纯的介绍科研新进展,不算是专业的医疗建议哦。