📢 转载信息
原文作者:Connie Loizos
从街上看,我发现Physical Intelligence位于旧金山的总部只有一个迹象:一个比门上其他部分颜色略有不同的π(圆周率)符号。当我走进去时,我立刻被眼前的活动所吸引。没有前台,没有荧光灯下闪闪发光的标志。
里面是一个巨大的混凝土盒子,一些杂乱无章的长条形浅色木桌让它看起来不那么单调。有些桌子显然是用来吃午饭的,上面散落着女童子军饼干盒、Vegemite(有人在这里是澳大利亚人)罐子,以及塞满了过多调味品的黑色小铁篮。其余的桌子则讲述着完全不同的故事。更多的桌子上堆满了显示器、备用机器人零件、纠缠在一起的黑线,以及各种形态的、正努力掌握日常琐事的完全组装好的机械臂。
在我访问期间,一只手臂正在叠一条黑裤子,或者说正在尝试。进行得不太顺利。另一只手臂正试图将一件T恤翻过来,带着一种暗示它最终会成功,只是不是今天的决心。第三只——这只似乎找到了自己的使命——正在快速地削一个西葫芦,之后它应该把削下的皮放进一个单独的容器里。至少,削皮部分进行得很顺利。
“把它想象成机器人的ChatGPT,”Sergey Levine一边指着房间里正在上演的机械芭蕾一边对我说。Levine是加州大学伯克利分校的副教授,也是Physical Intelligence的联合创始人之一。他带着那种和蔼可亲、戴着眼镜的样子,就像一个花了很多时间向那些不能立即理解复杂概念的人解释他们的人。
他解释说,我所看到的是一个持续循环的测试阶段:数据在公司这里以及其他地点——仓库、家庭,或团队可以设立的任何地方——的机器人工作站上被收集,然后这些数据用于训练通用的机器人基础模型。当研究人员训练一个新模型时,它会回到像这样的工作站进行评估。叠裤子是某人的实验。翻T恤也是。削西葫芦的测试可能是为了检验模型是否能在不同蔬菜之间泛化,学习到足够的削皮基本动作,以便能处理它从未遇到过的苹果或土豆。
该公司在这个建筑和其他地方也运营着一个测试厨房,使用现成的硬件来让机器人接触不同的环境和挑战。附近有一个先进的意式浓缩咖啡机,我原以为是给员工准备的,直到Levine澄清说,不,它是给机器人学习用的。任何打发的拿铁咖啡都是数据,而不是为现场几十名工程师提供的福利,他们中的大多数人都在盯着电脑或徘徊在他们的机械实验旁。
硬件本身故意做得不那么吸引人。这些机械臂售价约为3500美元,而且这还是Levine所说的来自供应商的“巨额加价”。如果他们自己制造,材料成本将低于1000美元。几年前,他说,一个机器人专家会对这些东西能做任何事感到震惊。但这正是重点——好的智能可以弥补糟糕的硬件。
TechCrunch 创始人峰会 2026:门票开售
6月23日,在波士顿,超过1,100位创始人将齐聚TechCrunch 创始人峰会 2026,共同度过充实的一天,重点关注增长、执行和现实世界的规模化。向塑造了行业的创始人和投资者学习。与正在经历相似增长阶段的同行建立联系。带走您可以立即应用的策略
购买门票可节省高达300美元,或团队(四人或以上)可享受高达30%的团体票折扣。
TechCrunch 创始人峰会:门票开售
6月23日,在波士顿,超过1,100位创始人将齐聚TechCrunch 创始人峰会 2026,共同度过充实的一天,重点关注增长、执行和现实世界的规模化。向塑造了行业的创始人和投资者学习。与正在经历相似增长阶段的同行建立联系。带走您可以立即应用的策略
购买门票可节省高达300美元,或团队(四人或以上)可享受高达30%的团体票折扣。
正当Levine告辞时,Lachy Groom向我走来,他穿梭在空间中的样子,像一个同时有六件要事在进行的人。31岁的Groom仍然带着硅谷“神童”那种稚气未脱的样子,这个称谓他很早就获得了,因为他在13岁时在澳大利亚老家创办第一家公司仅仅九个月后就将其出售了(这也解释了为什么会有Vegemite)。
当我早些时候第一次接近他,当时他正欢迎一群穿着运动衫的访客进入大楼时,他对我的请求时间的回复是立即的:“绝对不行,我有会议。”现在他可能只有十分钟时间。
Groom在开始关注Levine的实验室以及Levine的前博士生Chelsea Finn(她现在在斯坦福大学经营自己的实验室,专注于机器人学习)的学术成果时,找到了他想要的东西。凡是机器人领域发生有趣的事情,他们的名字都会反复出现。当他听说他们可能要创办一家公司时,他找到了Karol Hausman,一位曾在斯坦福任教、现任职于谷歌DeepMind的研究人员,Groom得知他参与其中。“那是一次会面,你走出去会觉得,‘就是这个了’。”
Groom告诉我,他从未打算成为一名全职投资者,尽管鉴于他的过往记录,一些人可能会好奇为什么不。在离开Stripe(他曾是早期员工)后,他大约花了五年时间作为天使投资人,对Figma、Notion、Ramp和Lattice等公司进行了早期投资,同时也在寻找自己要创办或加入的合适公司。他的第一笔机器人投资是在2021年投给Standard Bots,这让他重新接触到自己童年时通过搭建乐高Mindstorms而热爱的领域。正如他开玩笑说,作为投资者时他“度假的时间多多了”。但投资只是为了保持活跃和结识人脉的一种方式,而不是最终目标。“我花了五年时间寻找在Stripe之后创办的公司,”他说。“在合适的时间、与优秀的团队一起,拥有好的想法——[这]极其罕见。一切都关乎执行,但你可以在一个坏主意上拼命执行,它仍然是一个坏主意。”
这家成立两年的公司现在已经筹集了超过10亿美元的资金,当我问及公司的“跑道”(即烧钱速度)时,他很快澄清说,实际花费并没有那么多。他们的大部分开支都用于计算资源。片刻之后,他承认,在合适的条款和合适的合作伙伴下,他会再筹集更多资金。“我们能投入使用的资金真的没有上限,”他说。“总有更多的计算能力可以投入到这个问题中。”
这种安排特别不寻常的一点是Groom没有给他的支持者任何关于Physical Intelligence何时能盈利的时间表。“我不给投资者提供关于商业化的答案,”他谈到包括Khosla Ventures、Sequoia Capital和Thrive Capital在内的投资者时说,这些投资者将这家公司的估值定在了56亿美元。“人们能容忍这一点,这很奇怪。”但他们确实容忍了,而且可能不会永远容忍,这就是为什么公司现在有充足资本是有益处的。
那么,如果不是商业化,策略是什么呢?另一位联合创始人Quan Vuong(他也来自谷歌DeepMind)解释说,策略围绕着跨实体学习和多样化的数据源。如果有人明天建立一个新的硬件平台,他们就不需要从头开始收集数据——他们可以转移模型已经拥有的所有知识。“将自主性(autonomy)引入新机器人平台的边际成本,无论该平台可能是什么,都会低得多,”他说。
该公司已经在与物流、杂货店、以及街对面的巧克力制造商等不同垂直领域的少数几家公司合作,以测试他们的系统是否足以用于现实世界的自动化。Vuong声称,在某些情况下,它们已经做到了。凭借他们的“任何平台、任何任务”的方法,成功的机会范围足够大,可以开始解决那些已准备好进行自动化处理的任务。
Physical Intelligence在追求这一愿景的道路上并不孤单。构建通用机器人智能——其基础是可以在其上构建更专业的应用程序,就像三年前风靡全球的LLM模型一样——的竞赛正在升温。总部位于匹兹堡的Skild AI成立于2023年,本月刚刚以140亿美元的估值筹集了14亿美元,其方法明显不同。虽然Physical Intelligence仍专注于纯粹的研究,但Skild AI已经将其“全能机身”(omni-bodied)的Skild Brain投入商业应用,称其去年在安全、仓库和制造领域仅几个月就创造了3000万美元的收入。
Skild甚至公开抨击竞争对手,在其博客上辩称,大多数“机器人基础模型”只是“伪装起来的”视觉语言模型,缺乏“真正的物理常识”,因为它们过度依赖互联网规模的预训练,而不是基于物理的模拟和真实的机器人数据。
这是一个相当尖锐的哲学分歧。Skild AI押注于商业部署可以创造一个随着每一次现实世界用例而改进模型的“数据飞轮”。Physical Intelligence则押注于抵制短期商业化的拉力,将使其能够产生更卓越的通用智能。谁“更正确”需要数年时间才能揭晓。
与此同时,Physical Intelligence的运作以Groom所描述的异常清晰的方式进行。“这是一个非常纯粹的公司。研究人员有需求,我们就去收集支持这种需求的数据——或者新的硬件或任何东西——然后我们就去做。它不是外部驱动的。”他说,公司有一个关于团队认为可能实现的目标的5到10年路线图。到了第18个月,他们已经远远超出了这个计划。
公司约有80名员工,并计划继续增长,尽管Groom说希望“增长尽可能慢”。他说,最具挑战性的是硬件。“硬件就是很难。我们所做的一切比软件公司要困难得多。”硬件会损坏。它的交付很慢,会延迟测试。安全方面的考虑让一切都复杂化了。
当Groom匆忙赶往下一个约会起身离开时,我继续观看机器人练习。裤子仍然没有叠好。T恤仍然顽固地保持着正面向外。西葫芦皮正在漂亮地堆积着。
很明显存在一些问题,包括我自己的疑问:是否真的有人想要一个在厨房里削蔬菜的机器人,关于安全性,关于狗们对闯入家中的机械装置的疯狂反应,关于投入这里的所有时间和金钱是否解决了足够大的问题或是否会制造新的问题。与此同时,外界质疑公司的进展,他们的愿景是否可以实现,以及押注于通用智能而非特定应用是否明智。
如果Groom有任何疑虑,他没有表现出来。他正在与那些几十年来一直在研究这个问题并相信时机终于成熟的人一起工作,这对他就足够了。
此外,自该行业诞生以来,硅谷一直在支持像Groom这样的人,并给予他们很大的自由度,他们知道,即使没有明确的商业化路径,没有时间表,甚至不确定到达时市场会是什么样子,他们最终也会想办法解决。并非每次都成功。但当它成功时,往往能证明那些失败是值得的。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区