最近啊,我在网上看到一篇文章,美国《科学日报》的,说的是人类语言为什么不用“1”和“0”来表达。科学家们发现,虽然计算机使用二进制代码可以更高效地压缩信息,但人类的大脑更喜欢那种相对复杂、但更贴近我们日常生活经验的方式来交流。德国的迈克尔·哈恩和美国加州大学欧文分校的理查德·富特雷尔一起研究这个问题。他们给全球大约7000种语言建立了一个模型来解释这个现象。他们的研究成果发表在《自然·人类行为》杂志上。这个模型显示,人们在处理词汇时会把它和已知的世界经验联系起来,所以大脑处理起来就轻松多了。比如开车上班这条路你熟悉得很,几乎不用动脑就能走下去。但是如果你换一条不熟悉的路,就要费更多心思。 哈恩和富特雷尔用数学方法证明了这些规律。他们认为,人类语言追求的是减少认知负担而不是最大程度地压缩信息。这个发现对AI大语言模型也有帮助。了解人类大脑怎么处理语言,就能设计出更符合自然交流模式的AI系统了。 现在全球还有7000多种语言在用呢,汉语、英语、西班牙语还有印地语这些都有数十亿人用呢。这些语言通过把单词组合成短语,再把短语排列成句子来传递信息。虽然看起来有点乱码,但其实挺有效的。因为每个部分都有自己的意思,组合在一起就明白了。 其实人类的大脑喜欢这种熟悉的表达方式。虽然二进制代码理论上更高效、更紧凑,“1”和“0”这些符号能把信息压缩得更小一些,“但对我们的大脑来说走那条复杂路线反而更容易”,哈恩说。纯粹的数字代码可能更快传送信息,“但它们脱离日常体验”,“就像换一条不熟悉的路开车”,“大脑得更集中注意力才觉得累”,“这样就给我们的大脑带来了额外的负担”。 所以说呀,“我们把词汇和我们已知世界互动”,“比如这个单词我知道是什么意思”,“那个短语我以前听过”,“这样就可以很顺畅地交流了”,“而且还挺轻松的”。“而二进制代码需要说话者和听者都付出更多脑力劳动”,“因为他们不熟悉那种方式”。 王会聪译。 最后呢,“这篇文章告诉我们”,“科学家揭示了人类语言为何不同于计算机代码”,“美国2月20日发的文章”,“通过研究发现”,“这个解释不仅是科学研究的成果”,“还可能帮助我们设计更好的AI系统”,“让它们更符合人类自然交流模式”。