📢 转载信息
原文作者:Rebecca Bellan
利用游戏视频打造AI新前沿:General Intuition 获得巨额融资
Medal 是一家用于上传和分享电子游戏精彩瞬间的平台。它刚刚催生了一个前沿AI研究实验室——General Intuition。该实验室正利用Medal海量的游戏视频库,来训练和构建基础模型及AI智能体,使其能够理解物体和实体如何在空间和时间中移动,即所谓的“空间-时间推理”(spatial-temporal reasoning)。
General Intuition 坚信,Medal 平台上海量的游戏数据集(每年来自1000万月活跃用户、跨越数万款游戏的20亿视频)优于 Twitch 或 YouTube 等替代数据源,是训练智能体的理想选择。
游戏数据驱动的独特优势
Medal 和 General Intuition 的首席执行官 Pim de Witte 告诉 TechCrunch:“当你玩电子游戏时,你基本上是将你的感知,通常是通过第一人称视角,转移到不同的环境中。” 他指出,上传片段的游戏玩家倾向于分享非常积极或消极的极端案例,这恰好为训练提供了非常有用的“边缘案例”数据。“你获得了恰恰是你希望用于训练的这种数据选择偏见。”
正是这种数据壁垒吸引了 OpenAI 的注意。据《The Information》报道,OpenAI 在去年年底曾试图以5亿美元收购 Medal。(OpenAI 和 General Intuition 均未对此报道发表评论。)

这种独特的吸引力也促使 General Intuition 成功获得了高达1.337亿美元的种子轮融资,本轮融资由 Khosla Ventures 和 General Catalyst 领投,Raine 参与跟投。
资金用途与技术突破
这家初创公司计划利用这笔资金来扩大其研究人员和工程师团队,专注于训练一个能够与周围世界互动的通用智能体(general agent)。初步应用目标集中在游戏领域,以及搜索与救援无人机。
De Witte 表示,创始团队已经取得了显著进展:General Intuition 的模型能够理解它未曾训练过的环境,并能准确预测其中的动作。它完全通过视觉输入实现这一点;智能体仅能看到人类玩家所看到的内容,并通过遵循控制器输入在空间中移动。该公司表示,这种方法可以自然地迁移到物理系统,如机器人手臂、无人机和自动驾驶汽车,这些系统通常也是通过游戏手柄进行操作的。
商业化路线:避开版权争议
General Intuition 的下一个里程碑是双重的:生成新的模拟世界用于训练其他智能体,以及自主导航到完全陌生的物理环境中。
这种技术路线正在塑造该公司如何对其技术进行商业化,并使其与构建世界模型的竞争对手区分开来。
尽管 General Intuition 也在构建世界模型来训练其智能体,但这些模型本身并不是最终产品。与其他世界模型制造商(如 DeepMind 的 Genie 和 World Labs 的 Marble)不同,他们分别销售其世界模型用于训练智能体和内容创作,General Intuition 正专注于避免版权问题的其他应用场景。
“我们的目标不是生产与游戏开发者竞争的模型,” de Witte 说道。
超越传统游戏AI
相反,该初创公司的游戏应用侧重于创建能够超越传统“确定性机器人”(deterministic bots)的机器人和非玩家角色(NPC)。确定性机器人是预先编程的角色,每次都会产生相同的输出。
General Intuition 的创始成员兼 Lightspeed Ventures 合伙人 Moritz Baier-Lentz 告诉 TechCrunch:“这些机器人可以扩展到任何难度级别。”“创造一个能击败所有人的‘神级机器人’并没有吸引力,但如果你能逐步扩展,并在任何玩家情况下提供流动性,使其胜率始终保持在50%左右,这将最大化玩家的参与度和留存率。”
迈向通用人工智能(AGI)的关键一步
De Witte 曾从事人道主义工作,这影响了该公司专注于为搜索和救援无人机提供动力。这些无人机有时必须在不熟悉的环境中导航并提取信息,而无需 GPS。
最终,De Witte 和 Baier-Lentz 认为,General Intuition 的核心功能——空间-时间推理——是人工智能通用智能(AGI)竞赛中的一个关键组成部分。尽管主要的 AI 实验室专注于构建越来越强大的大型语言模型(LLM),但 General Intuition 认为真正的 AGI 需要 LLM 根本缺乏的东西。
“作为人类,我们会用文本来描述我们周围世界发生的事情,但在这样做的时候,你会丢失很多信息,” de Witte 总结道。“你失去了关于空间-时间推理的普遍直觉。”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区