📢 转载信息
原文链接:https://www.nature.com/articles/d41586-026-00285-6
原文作者:Eddy Keming Chen, Mikhail Belkin, Leon Bergen & David Danks
在1950年,艾伦·图灵(Alan Turing)在其题为《计算机器与智能》的论文中1,提出了他的“模仿游戏”,即现今所称的图灵测试。该测试旨在探讨一个看似纯粹假设性的问题:机器是否能展现出人类思维所特有的那种灵活的、通用的认知能力,以至于能蒙骗未察觉的人类,让他们误以为是在与人类交流?
时隔四分之三个世纪,答案似乎是“肯定的”。2025年3月,OpenAI(位于美国加利福尼亚州旧金山)开发的大型语言模型(LLM)GPT-4.5,在图灵测试中被人类判定为人类的概率达到了73%——这一比例甚至高于实际人类的表现2。更进一步说,读者甚至更喜欢由LLM生成的文学作品,而非人类专家的作品3。
这还远不止于此。LLM已经在国际数学奥林匹克竞赛中取得了金牌水平的表现,与顶尖数学家合作证明了定理4,生成了在实验中得到验证的科学假设5,解决了博士生考试中的难题,协助专业程序员编写代码,创作诗歌等等——包括全天候与全球数亿人进行交流。换言之,LLM已经展现出图灵所关注的那种广泛、灵活的认知能力的许多迹象——也就是我们现在所说的“通用智能”,尽管图灵本人并未明确使用这个术语。
智能的未来是什么?答案可能在于其演变的历史
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区