OpenAI 推出可读性更强的 GPT-4o 模型：更快的响应速度和更低的价格-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://www.bbc.com/news/articles/c5ydndkmvy2o?at_medium=RSS&at_campaign=rss

原文作者：BBC News

人工智能公司OpenAI发布了其最新的旗舰模型GPT-4o，该模型在处理速度、成本和多模态能力方面均有显著提升。

该公司称，GPT-4o（“o”代表“omni”，意为“全能”）在保持与GPT-4 Turbo相同的智能水平的同时，响应速度更快，成本更低。

“我们对这些改进感到非常兴奋，”OpenAI的研究科学家杰克·雅莫斯基（Jakub Kaczmarek）表示，“我们认为这对于用户来说将是一次巨大的飞跃。”

OpenAI的目标是让AI更加自然、直观，并且可以像人类一样进行实时交流。

GPT-4o不仅能处理文本，还能理解音频和图像，并且是原生支持这些功能的，而不是像以前那样依赖不同的模型进行转换。

在音频处理方面，GPT-4o的平均响应时间为320毫秒，最快可达232毫秒，这与人类对话时的反应时间相近。

与此前的模型相比，GPT-4o在文本和视觉处理方面的延迟也更低，并且API价格降低了50%。

更具表现力的语音互动

“我们正在向着更自然的人机互动迈进，”OpenAI的首席技术官伊利亚·苏茨克维（Ilya Sutskever）在一次演示中说。

在演示中，GPT-4o被展示了与人类进行实时语音对话的能力。它不仅能理解用户的语言，还能感知语音中的情感和语调，并以更具表现力的方式回应。

例如，当用户要求GPT-4o像唱歌剧一样朗读一个故事时，模型能够模仿歌剧的风格来朗读。

此外，该模型在视觉理解方面也得到了增强。用户可以向模型展示一个数学题，模型可以实时指导解题过程，并能感知用户在纸上写字时的情绪变化。

GPT-4o模型演示图

OpenAI的首席执行官萨姆·奥尔特曼（Sam Altman）表示，他认为GPT-4o的推出是AI发展的关键一步，使其“感觉更像一个真正的智能体”。

“我们希望AI能够真正成为一个有帮助的助手，而不仅仅是一个信息检索工具，”奥尔特曼说，“GPT-4o在这方面做得更好。”

面向所有用户的免费版本

OpenAI表示，GPT-4o将逐步向所有用户推出，包括免费用户。

免费用户可以使用GPT-4o，但有使用次数限制。付费用户将享有更高的使用额度。

此外，该公司还宣布了对ChatGPT应用的新功能，包括：

OpenAI在发布会上强调，GPT-4o的推出旨在让AI技术惠及更广泛的人群，提升日常工作的效率和体验。

然而，伴随着这些强大的新功能，安全性和伦理方面的讨论也再次浮现。OpenAI表示，他们已经采取了措施来防止滥用，但批评人士仍然担心这类高度先进的AI模型可能带来的潜在风险。

GPT-4o已经开始向ChatGPT Plus、团队和企业用户以及API开发者推出。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

OpenAI 推出可读性更强的 GPT-4o 模型：更快的响应速度和更低的价格