马萨诸塞大学阿默斯特分校领导的最新研究评估了机器学习如何通过声音识别不同的昆虫物种,从携带疟疾的蚊子和饥饿的象鼻虫到农作物授粉的蜜蜂和吸汁的蝉。
倾听昆虫世界为我们提供了一种监测昆虫种群变化的方法,因此可以告诉我们环境的整体健康状况。这项发表在《应用生态学杂志》上的研究表明,机器和深度学习正在成为自动化生物声学建模的黄金标准,生态学家和机器学习专家可以卓有成效地合作,充分发挥该技术的潜力。
“昆虫着世界,”麻省大学阿默斯特分校环境保护助理教授、该论文的资深作者劳拉·菲格罗亚 (Laura Figueroa) 说。 “有些是疾病媒介和害虫,而另一些则为营养作物授粉并循环养分。它们是世界各地生态系统的基础,是鸟类、鱼类、熊和人类等动物的食物。我们所见之处,都有昆虫,但很难了解它们的种群正在发生怎样的变化。”
事实上,在化学农药、气候变化和其他环境压力的时代,昆虫种群正在发生巨大变化。一些物种——比如每年为全球生态系统服务带来的价值估计超过 2000 亿美元的传粉媒介——似乎正在崩溃,而另一些物种,比如携带疟疾、登革热和其他疾病的蚊子,似乎正在激增。然而,要准确了解昆虫种群的变化情况可能很困难。
许多传统的昆虫种群采样方法都涉及派遣昆虫学家到野外收集和识别单个物种,虽然这些方法可以产生可靠的结果,但它也需要大量时间和资源,并且通常对捕获的昆虫来说是致命的。这就是人工智能发挥作用的地方。
“在该领域工作十多年后,我可以区分蜜蜂的嗡嗡声和苍蝇的嗡嗡声,”菲格罗亚说。 “由于许多(但不是全部)昆虫都会发出声音,因此我们应该能够训练人工智能模型通过它们发出的独特声音来识别它们。”
事实上,这样的训练已经在发生——但哪种人工智能方法最好呢?
为了回答这个问题,菲格罗亚和她的同事,包括主要作者·科尔伯格(Anna Kohlberg),她在菲格罗亚实验室工作时完成了这项研究,进行了系统的文献综述,以分析使用不同类型的自动化生物声学模型来识别昆虫的研究。他们发现了分布在 9 个分类目中 302 个不同物种的模型。他们将所得模型分为三大类:非机器学习、机器学习和深度学习。
玩
00:50
01:21
沉默的
设置
蜜蜂在寻找花蜜和花粉时发出的独特嗡嗡声。图片来源:劳拉·菲格罗亚
非机器学习模型将昆虫的叫声与人类研究人员指定为识别关键的特定标记相匹配,例如螽斯叫声中的特定频段。然后,该模型“聆听”那些特定的、人类指定的线索。
另一方面,机器学习没有使用预先设定的标记集,而是依赖灵活的计算框架来查找声音中的相关模式,然后将这些模式与经过训练的生物声学数据进行匹配。
深度学习是一种特殊的机器学习,依赖于更先进的神经计算框架,使模型在有效识别相关生物声学模式方面具有更大的灵活性。事实证明,依赖深度学习的模型是最成功的。一些最好的可以对数百个物种进行分类,准确率超过 90%。
科尔伯格说:“这并不意味着人工智能可以或应该取代所有传统的监控方法,”而且它们的作用是有限的。大多数模型需要大量数据进行训练,虽然它们在处理较小数据集方面做得越来越好,但它们仍然是数据密集型工具。此外,并非所有昆虫都会发出声音,例如蚜虫。非常嘈杂的环境(例如城市环境)很容易混淆基于声音的监控工作。
“自动化生物声学是多方面工具箱中的一个关键工具,我们可以用它来有效监测世界各地的这些重要生物体,”科尔伯格说。