您的位置:首页 >生活 >

人工智能在创造性潜力的标准化测试中胜过人类

导读 在最近的一项研究中,151名人类参与者在三项旨在衡量发散性思维的测试中与ChatGPT-4进行对抗,发散性思维被认为是创造性思维的指标。发散性...

在最近的一项研究中,151名人类参与者在三项旨在衡量发散性思维的测试中与ChatGPT-4进行对抗,发散性思维被认为是创造性思维的指标。

发散性思维的特点是能够对没有预期解决方案的问题生成独特的解决方案,例如“避免与父母谈论政治的最佳方法是什么?”在这项研究中,GPT-4提供了比人类参与者更原始、更详尽的答案。

这项研究“人工智能生成语言模型的现状在发散性思维任务上比人类更具创造力”,发表在《科学报告》上,由阿尔伯塔大学博士撰写。心理科学专业的学生KentF.Hubert和KimN.Awa,以及阿尔伯塔大学心理科学助理教授兼创造性认知和注意力机制实验室主任DaryaL.Zabelina。

使用的三个测试是替代用途任务,该任务要求参与者对绳子或叉子等日常物品提出创造性的用途;结果任务,邀请参与者想象假设情况的可能结果,例如“如果人类不再需要睡眠怎么办?”;发散关联任务要求参与者生成10个语义尽可能遥远的名词。例如,“狗”和“猫”之间的语义距离并不大,而“猫”和“本体”等词之间的语义距离却很大。

根据回复数量、回复长度和单词之间的语义差异来评估答案。最终,作者发现“总的来说,GPT-4在每项发散思维任务上都比人类更具原创性和复杂性,即使在控制反应的流畅性时也是如此。换句话说,GPT-4在整个电池中表现出了更高的创造潜力发散思维任务。”

这一发现确实有一些告。作者指出,“值得注意的是,本研究中使用的衡量标准都是创造性潜力的衡量标准,但参与创造性活动或取得的成就是衡量一个人创造力的另一个方面。”该研究的目的是检查人类水平的创造潜力,而不一定是那些可能已经建立了创造资格的人。

休伯特和阿瓦进一步指出,“人工智能与人类不同,没有代理权”,并且“依赖于人类用户的帮助。因此,除非得到提示,否则人工智能的创造潜力将处于持续停滞状态。”

此外,研究人员没有评估GPT-4反应的适当性。因此,虽然人工智能可能提供了更多的反应和更多的原创反应,但人类参与者可能会觉得他们的反应需要扎根于现实世界,从而受到限制。

阿瓦还承认,人类写出详尽答案的动机可能并不高,并表示还有其他问题,例如“如何发挥创造力?我们真的可以说,对人类使用这些测试可以推广到不同的人吗?它是否在评估广泛的创造性思维?所以我认为它让我们批判性地审视什么是最流行的发散性思维衡量标准。”

测试是否能完美衡量人类的创造潜力并不是真正的重点。关键是大型语言模型正在迅速进步,并以前所未有的方式超越人类。它们是否会威胁取代人类创造力还有待观察。

目前,作者继续认为“展望未来,人工智能作为灵感工具、帮助人们的创作过程或克服固定性的可能性是有希望的。”

免责声明:本文由用户上传,如有侵权请联系删除!