📢 转载信息
原文链接:https://www.bbc.com/news/articles/c5ydndkmvy2o?at_medium=RSS&at_campaign=rss
原文作者:BBC News
人工智能公司OpenAI发布了其最新的旗舰模型GPT-4o,该模型在处理速度、成本和多模态能力方面均有显著提升。
该公司称,GPT-4o(“o”代表“omni”,意为“全能”)在保持与GPT-4 Turbo相同的智能水平的同时,响应速度更快,成本更低。
“我们对这些改进感到非常兴奋,”OpenAI的研究科学家杰克·雅莫斯基(Jakub Kaczmarek)表示,“我们认为这对于用户来说将是一次巨大的飞跃。”
OpenAI的目标是让AI更加自然、直观,并且可以像人类一样进行实时交流。
GPT-4o不仅能处理文本,还能理解音频和图像,并且是原生支持这些功能的,而不是像以前那样依赖不同的模型进行转换。
在音频处理方面,GPT-4o的平均响应时间为320毫秒,最快可达232毫秒,这与人类对话时的反应时间相近。
与此前的模型相比,GPT-4o在文本和视觉处理方面的延迟也更低,并且API价格降低了50%。
更具表现力的语音互动
“我们正在向着更自然的人机互动迈进,”OpenAI的首席技术官伊利亚·苏茨克维(Ilya Sutskever)在一次演示中说。
在演示中,GPT-4o被展示了与人类进行实时语音对话的能力。它不仅能理解用户的语言,还能感知语音中的情感和语调,并以更具表现力的方式回应。
例如,当用户要求GPT-4o像唱歌剧一样朗读一个故事时,模型能够模仿歌剧的风格来朗读。
此外,该模型在视觉理解方面也得到了增强。用户可以向模型展示一个数学题,模型可以实时指导解题过程,并能感知用户在纸上写字时的情绪变化。

OpenAI的首席执行官萨姆·奥尔特曼(Sam Altman)表示,他认为GPT-4o的推出是AI发展的关键一步,使其“感觉更像一个真正的智能体”。
“我们希望AI能够真正成为一个有帮助的助手,而不仅仅是一个信息检索工具,”奥尔特曼说,“GPT-4o在这方面做得更好。”
面向所有用户的免费版本
OpenAI表示,GPT-4o将逐步向所有用户推出,包括免费用户。
免费用户可以使用GPT-4o,但有使用次数限制。付费用户将享有更高的使用额度。
此外,该公司还宣布了对ChatGPT应用的新功能,包括:
- 实时语音对话: 允许用户进行更自然的、无需等待的语音交流。
- 视觉输入: 用户可以直接向模型展示屏幕截图或上传图片进行分析。
- 智能体能力: 能够更好地执行复杂任务和流程。
OpenAI在发布会上强调,GPT-4o的推出旨在让AI技术惠及更广泛的人群,提升日常工作的效率和体验。
然而,伴随着这些强大的新功能,安全性和伦理方面的讨论也再次浮现。OpenAI表示,他们已经采取了措施来防止滥用,但批评人士仍然担心这类高度先进的AI模型可能带来的潜在风险。
GPT-4o已经开始向ChatGPT Plus、团队和企业用户以及API开发者推出。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区