您的位置:首页 >生活 >

为什么接触我们的沙鼠大脑可以帮助机器更好地倾听

导读 麦考瑞大学的研究人员揭穿了一个已有 75 年历史的关于人类如何确定声音来源的理论,它可以解开创造下一代适应性更强、更高效的听力设备(...

麦考瑞大学的研究人员揭穿了一个已有 75 年历史的关于人类如何确定声音来源的理论,它可以解开创造下一代适应性更强、更高效的听力设备(从助听器到智能手机)的秘密。

20 世纪 40 年代,人们开发了一种工程模型来解释人类如何根据声音到达每只耳朵时仅几十百万分之一秒的差异来定位声源。

该模型的理论基础是,我们必须拥有一组专门的探测器,其唯一功能是确定声音来自何处,并由专用神经元代表空间位置。

从那时起,它的假设就一直指导和影响研究以及音频技术的设计。

但麦格理大学听力研究人员在《当代生物学》上发表的一篇新研究论文最终表明,专门用于空间听力的神经网络的想法并不成立。

主要作者、麦考瑞大学杰出听力教授 David McAlpine 在过去 25 年里证明,一只又一只动物实际上使用的是稀疏得多的神经网络,大脑两侧的神经元除了执行其他功能外,还执行此功能。

在人类身上展示这一点更加困难。

现在,通过结合专门的听力测试、先进的大脑成像以及与包括恒河猴在内的其他哺乳动物的大脑进行比较,他和他的团队首次证明人类也使用这些更简单的网络。

麦卡尔平教授说:“我们喜欢认为我们的大脑在各个方面都比其他动物先进得多,但这只是狂妄自大。”

“我们已经能够证明沙鼠就像豚鼠,豚鼠就像恒河猴,而恒河猴在这方面就像人类。

“一种稀疏的、节能的神经回路形式执行此功能——我们的沙鼠大脑,如果你愿意的话。”

研究小组还证明,相同的神经网络可以将语音与背景声音分开,这一发现对于听力设备和手机中的电子助理的设计具有重要意义。

所有类型的机器听力都面临着噪音中听力的挑战,即所谓的“鸡尾酒会问题”。这使得佩戴听力设备的人很难在拥挤的空间中辨别出一种声音,而我们的智能设备也很难在我们与他们交谈时理解他们的声音。

麦卡尔平教授表示,他的团队的最新发现表明,我们不应该关注当前使用的大型语言模型(LLM),而应该采取更简单的方法。

“法学硕士在预测句子中的下一个单词方面非常出色,但他们试图做得太多,”他说。

“能够找到声音的来源在这里很重要,要做到这一点,我们不需要&luo;深层思维&ruo;语言大脑。其他动物可以做到这一点,但它们没有语言。

“当我们在听的时候,我们的大脑不会一直跟踪声音,而大型语言处理器正在努力做到这一点。

“相反,我们和其他动物使用我们的&luo;浅层大脑&ruo;来挑选出非常小的声音片段,包括语音,并使用这些片段来标记位置,甚至可能标记来源的身份。

“我们不必重建高保真信号来做到这一点,而是在信号到达皮层的语言中心之前了解我们的大脑如何在神经上表示该信号。

“这向我们表明,机器不必像人脑一样接受语言训练就可以有效地倾听。

“我们只需要沙鼠的大脑。”

该团队的下一步是确定声音中可以传达的最小信息量,但仍能获得最大的空间聆听量。

免责声明:本文由用户上传,如有侵权请联系删除!