📢 转载信息
原文作者:Russell Brandom
最近几个月涌现出许多令人兴奋的研究型AI实验室,而 Flapping Airplanes 是其中最引人注目的一家。这家实验室由年轻而好奇的创始人推动,专注于寻找数据需求更少的AI训练方法。这对于AI模型的经济性和能力来说可能是一个游戏规则的改变者——凭借 1.8 亿美元的种子轮融资,他们将有充足的跑道来探索。
上周,我与实验室的三位联合创始人——兄弟二人 Ben 和 Asher Spector,以及 Aidan Smith——就为什么现在是创办一家新的AI实验室的激动人心的时刻,以及他们为何不断回归到与人脑相关的想法进行了交谈。
我想从这个问题开始:为什么是现在?像 OpenAI 和 DeepMind 这样的实验室已经在模型扩展上投入了巨额资金。我确信竞争看起来令人望而生畏。为什么你觉得现在是启动一家基础模型公司的绝佳时机?
Ben: 实在是太多的事情要做。过去五到十年取得的进步是惊人的。我们喜欢这些工具,每天都在使用它们。但问题是,这就是所有需要发生的事情的全部宇宙吗?我们非常仔细地思考了这个问题,我们的答案是否定的,还有很多事情要做。就我们而言,我们认为数据效率问题是真正需要关注的关键所在。当前的尖端模型是在人类知识的总和上进行训练的,而人类显然可以用少得多的数据完成任务。所以这里存在巨大的差距,值得我们去理解。
我们所做的是对三件事的集中押注:第一,我们押注数据效率问题是值得研究的重要方向,即这是一个新的、不同的方向,并且可以在上面取得进展。第二,我们押注这在商业上将具有巨大的价值,并且如果能实现,将使世界变得更美好。第三,我们也押注,要完成这项工作,最合适的团队应该是富有创造力,甚至在某种程度上是没有经验的团队,这样才能从根本上重新审视这些问题。
Aidan: 是的,绝对如此。我们并不认为自己在与那些其他实验室竞争,因为我们认为我们正在研究的是完全不同的一组问题。如果你看看人脑,它学习的方式与 Transformer 截然不同。这并不是说人脑更好,只是非常不同。因此,我们看到了不同的权衡。大型语言模型(LLM)具有令人难以置信的记忆能力,并能利用广泛的知识,但它们不能很快掌握新技能。适应需要海量的数据。而当你观察人脑内部时,你会发现它使用的算法在根本上与梯度下降以及人们今天用来训练AI的一些技术是如此不同。所以,这就是我们正在建立一支新的研究人员队伍来解决这些问题,并真正从不同的角度思考AI领域的原因。
Asher: 这个问题在科学上非常有趣:我们构建的智能系统与人类所做的事情为什么会有如此大的不同?这种差异从何而来?我们如何利用对这种差异的了解来构建更好的系统?但同时,我也认为这实际上具有很高的商业可行性,对世界也很有益。许多非常重要的领域同样受到数据约束,例如机器人技术或科学发现。即使在企业应用中,一个数据效率提高一百万倍的模型,也可能更容易融入经济体系。所以,我们很高兴能对这些方法采取全新的视角,并思考:如果我们拥有一个数据效率高得多的模型,我们能用它做什么?
TechCrunch Founder Summit 2026: 门票开售
在6月23日于波士顿,将有超过1,100名创始人齐聚TechCrunch Founder Summit 2026,共同度过专注于增长、执行和现实世界扩展的一整天。向塑造了行业的创始人与投资者学习。与处于相似增长阶段的同行建立联系。带走您可以立即应用的策略。
购买门票可节省高达300美元,或为四人及以上团队购买可享高达30%的团体折扣。
TechCrunch Founder Summit: 门票开售
在6月23日于波士顿,将有超过1,100名创始人齐聚TechCrunch Founder Summit 2026,共同度过专注于增长、执行和现实世界扩展的一整天。向塑造了行业的创始人与投资者学习。与处于相似增长阶段的同行建立联系。带走您可以立即应用的策略。
购买门票可节省高达300美元,或为四人及以上团队购买可享高达30%的团体折扣。
这引出了我的下一个问题,也与你们的名字“Flapping Airplanes”(拍打翅膀的飞机)有关。AI领域有一个哲学问题:我们究竟在多大程度上试图重现人脑的工作方式,还是在创造一种走完全不同路径的更抽象的智能?Aidan来自Neuralink,那完全是关于人脑的。你们是更倾向于神经形态的AI观点吗?
Aidan: 我看待人脑的方式是将其视为存在证明。我们将其视为证据,证明存在其他的算法。并非只有一种正统的观点。人脑有一些非常奇特的限制。当你观察其底层硬件时,会发现一些惊人的事实。一个动作电位放电需要一毫秒。在这么短的时间内,你的计算机可以执行如此多的操作。所以很现实地说,可能存在一种比人脑更优秀、也与 Transformer 非常不同的方法。因此,我们深受人脑某些工作方式的启发,但我们并不认为自己必须受其束缚。
Ben: 让我补充一下。这在我们的名字中体现得很明显:Flapping Airplanes。把当前的系统想象成巨大的波音787。我们不是在试图建造鸟。那是走得太远了。我们正试图建造某种拍打翅膀的飞机。从计算机系统的角度来看,人脑和硅的约束条件存在充分的差异,以至于我们不应该期望这些系统看起来完全相同。当基底如此不同,并且在计算成本、数据局部性成本和数据移动成本方面有非常不同的权衡时,你实际上会期望这些系统看起来会略有不同。但仅仅因为它们看起来会有些不同,并不意味着我们就不应该从人脑中汲取灵感,并尝试利用我们认为有趣的部分来改进我们自己的系统。
现在感觉实验室有更多的自由专注于研究,而不是仅仅开发产品。这似乎是这一代实验室的一个巨大变化。有些实验室非常专注于研究,而另一些则只是“暂时专注于研究”。在 Flapping Airplanes 内部,这种对话是怎样的?
Asher: 我希望我能给出一个时间表。我希望我说,三年后,我们将解决研究问题,这就是我们商业化的方式。我做不到。我们不知道答案。我们正在寻找真相。话虽如此,我认为我们都有商业背景。我曾花大量时间为公司开发技术,为那些公司赚取了可观的收入。Ben 也孵化了一些具有商业背景的初创公司,而且我们实际上很期待商业化。我们认为将创造的价值交到能使用它的人手中对世界有益。所以我不认为我们反对商业化。我们只是需要从研究开始,因为如果我们一开始就签订大额企业合同,我们就会分心,而无法完成有价值的研究。
Aidan: 是的,我们想尝试真正、真正激进的不同事物,而有时即便是激进的想法也可能不如现有范式。我们正在探索一系列不同的权衡。我们希望它们在长期内会有所不同。
Ben: 公司在专注于把一件事做好时处于最佳状态,对吗?大公司可以同时做很多很多不同的事情。当你是一家初创公司时,你必须选择你能做的最有价值的事情,并把它做到极致。目前,当我们全力以赴解决基础性问题时,我们创造的价值最大。
我实际上很乐观,在不久的将来,我们可能会取得足够的进展,然后就可以开始接触真实世界了。你从真实世界的反馈中学习到很多东西。世界最神奇的地方在于,它不断地教给你东西,对吧?它是一个你可以随时查看的巨大的真理之池。我认为,最近的经济和融资结构变化所带来的最大便利是,让公司能够更长时间地专注于他们擅长的事情。我认为正是这种专注——这是我最兴奋的一点——将使我们能够完成真正与众不同的工作。
为了阐明我所理解的:周围有如此多的兴奋,投资者机会如此清晰,他们愿意向一家完全由这些非常聪明但又非常年轻的人组成的全新公司提供 1.8 亿美元的种子资金,这些人并没有从 PayPal 或其他地方套现。与这个过程打交道是怎样的?你们是一开始就知道存在这种需求,还是后来才发现,‘实际上,我们可以把这件事做得比我们想象的更大’。
Ben: 我会说是两者的结合。市场已经火热了很长时间了。所以,没有大额融资开始聚集并不是秘密。但你永远不确定融资环境会对你对世界的看法产生怎样的回应。这再次说明,你必须让世界给你反馈,告诉你正在做的事情。即使在我们融资的过程中,我们也学到了很多,并且实际上改变了我们的想法。我们完善了对应该优先考虑的事项以及商业化的合适时间表的看法。
我想我们对自己的信息引起了多大的共鸣感到有些惊讶,因为这对我们来说非常清楚,但你永远不知道你的想法是否会得到其他人的认可,或者他们是否都认为你疯了。我们非常幸运地找到了一群非常棒的投资者,我们的信息与他们产生了强烈的共鸣,他们说:“是的,这正是我们一直在寻找的。”这非常棒。这既令人惊讶又令人欣喜。
Aidan: 是的,对研究时代的渴望已经存在一段时间了。我们发现自己越来越多地被定位为追求研究时代、真正尝试这些激进想法的参与者。
至少对于那些规模驱动型的公司来说,基础模型存在巨大的进入成本。仅仅构建一个如此规模的模型就是一项计算密集型工作。研究处于中间地带,假设你们也在构建基础模型,但如果你们使用更少的数据并且不那么注重规模,也许可以获得一些喘息的机会。你们预计计算成本在多大程度上会限制你们的跑道。
Ben: 从事深入、基础性研究的好处之一是,有点矛盾的是,做非常疯狂、激进的想法比做渐进式的工作要便宜得多。因为当你做渐进式工作时,为了找出它是否有效,你必须沿着规模的阶梯爬得非常高。许多在小规模下看起来不错的干预措施在大规模时实际上并不能持续。因此,做那种工作非常昂贵。然而,如果你有一个关于新架构优化器之类的疯狂新想法,它很可能在第一次运行时就会失败,对吧?所以你不需要把它推到那么高的规模。它已经失败了。这很好。
所以,这并不意味着规模对我们不重要。规模实际上是你可以做的一切工具箱中的一个重要工具。能够扩展我们的想法当然与我们的公司相关。所以,我不会把自己定位为规模的反面,但我认为我们所做的工作的一个绝佳方面是,在我们需要考虑将它们用于大规模之前,我们可以在非常小的规模上尝试我们许多的想法。
Asher: 是的,你应该可以使用整个互联网。但你不应该需要使用整个互联网。我们觉得非常令人费解的是,你需要使用整个互联网才能真正获得这种人类级别的智能。
那么,如果你能更有效地利用数据进行训练,会发生什么?假设模型会更强大、更智能。但你们对未来的发展方向有具体的想法吗?我们是在关注更多的分布外泛化能力,还是在关注模型能用更少的经验在特定任务上变得更好?
Asher: 首先,我们正在做科学研究,所以我不知道答案,但我可以给出三个假设。我的第一个假设是,在仅仅寻找统计模式和真正具有深度理解的之间存在一个广泛的谱系。我认为目前的模型生活在这个谱系的某个地方。我不认为它们完全倾向于深度理解,但它们显然也不仅仅是在进行统计模式匹配。有可能的是,当你用更少的数据训练模型时,你会真正迫使模型对它所看到的一切产生极其深刻的理解。当你这样做时,模型可能会以非常有趣的方式变得更智能。它可能知道的事实更少,但在推理方面会做得更好。所以,这是一个潜在的假设。
另一个假设与你所说的类似,即目前,教模型新能力在操作上和纯粹的货币成本上都非常昂贵,因为你需要这么多数据来教它们这些东西。有可能我们工作的一个产出是,使训练后(post training)的效率大大提高,因此只需要几个例子,你就可以将模型真正投入到一个新领域。
然后,这也可能为 AI 开启新的垂直领域。例如,在某些类型的机器人技术中,由于某种原因,我们无法获得真正使其具有商业可行性的能力。我的看法是,这是一个有限的数据问题,而不是硬件问题。你能够遥控机器人做事情的事实证明硬件已经足够好了。但在许多这样的领域,例如科学发现。
Ben: 我想再深入探讨一下,当我们思考 AI 对世界可能产生的影响时,你可能持有一种观点,即这是一种通货紧缩技术。也就是说,AI 的作用是自动化许多工作,并将这些工作成本降低,从而能够将工作从经济体系中移除,转而由机器人来完成。我确信这种情况会发生。但对我来说,这并非 AI 最令人兴奋的愿景。AI 最令人兴奋的愿景是,我们可以构建出人类不够聪明而无法想出的各种新科学和新技术,而其他系统可以做到。
在这一点上,我认为 Asher 谈到的关于“真正泛化”与“记忆或数据插值”之间的谱系的第一条轴线,我认为这条轴线对于获得将带来医学和科学新进展的深刻见解至关重要。重要的是模型要在谱系的创造力一侧更偏重。因此,我对我正在做的工作感到非常兴奋的部分原因在于,我认为即使超越了个人经济影响,我实际上也非常有使命感地围绕着这个问题:我们能否真正让 AI 做一些人类以前根本做不到的事情?这不仅仅是‘让我们去解雇一群人的工作’。”
完全同意。这是否让你在 AGI 的对话中,也就是关于分布外泛化能力(out of distribution generalization)的阵营中,占据了特定的位置?
Asher: 我真的不太清楚 AGI 的确切含义。很明显,能力正在迅速发展。很明显,正在创造巨大的经济价值。依我看,我们离“盒中之神”(God-in-a-box)还很远。我不认为在两个月或两年内,就会出现一个奇点,让人类完全过时。我基本上同意 Ben 在一开始所说的,这是一个非常广阔的世界。有很多工作要做。有很多惊人的工作正在进行,我们很高兴能为此做出贡献。
嗯,关于大脑和神经形态的部分确实很有意义。你的意思是,与 LLM 相比,更相关的比较对象是人脑,而不是机械图灵机或之前的确定性计算机?
Aidan: 我要强调的是,人脑不是天花板,对吧?在许多方面,人脑是地板。坦率地说,我没有证据表明人脑不是一个遵循物理定律的可知系统。事实上,我们知道它受到许多约束。因此,我们应该期望在长期内能够创造出远比人脑更具趣味性、不同、甚至可能更好的能力。因此,我们很高兴能为这个未来做出贡献,无论它是否是 AGI。
Asher: 我确实认为人脑是一个相关的比较对象,仅仅是因为人脑有助于我们理解这个空间有多大。比如,很容易看到我们所取得的所有进步,然后想,哇,我们好像已经找到答案了,我们快完成了。但如果你稍微向外看一点,试图获得更多的视角,就会发现我们还有很多未知的东西。
Ben: 我们不一定试图变得更好。我们试图变得不同,对吧?这是我真正想强调的关键点。所有这些系统几乎肯定都会有不同的权衡。你在某处会获得优势,但在别处会付出代价。外面的世界很大。有如此多的不同领域,有如此多的不同权衡,拥有更多能够应对这些不同领域的系统和基础技术,很可能会使 AI 能够更有效、更快速地在世界上传播。
你们区分自己的一点是招聘方式,招聘非常非常年轻的人,在某些情况下,他们还在上大学或高中。当你与某人交谈时,是什么让你觉得,‘我希望这个人与我们一起研究这些问题’?
Aidan: 当你与某人交谈,他们用如此多新颖的想法让你惊艳,他们思考问题的方式是许多成名研究人员做不到的,因为他们没有被成千上万篇论文的背景所“污染”。真的,我们寻找的首要标准是创造力。我们的团队具有非凡的创造力,每天,我都很幸运能和大家一起讨论AI中一些大问题的激进解决方案,并一起构想一个非常不同的未来。
Ben: 我个人可能在寻找的头号信号是:与他们共度时光时,他们是否能教给我一些新东西?如果他们能教给我一些新东西,那么他们也会教给我们一些关于我们正在做的工作的新东西的几率就很高。当你做研究时,那些创造性的、新的想法才是真正的重点。
我的一部分背景是在本科和博士期间,我帮助启动了一个名为 Prod 的孵化器,与一些后来发展不错的公司合作。我认为我们从中学到的一点是,年轻人绝对可以在行业最高层面上竞争。坦率地说,一个很大的突破点就是认识到,是的,我可以去做这些事情。你绝对可以为最高水平的贡献而努力。
当然,我们也认识到经验的价值。在大型系统上工作过的人很棒——我们雇佣了一些这样的人,我们很高兴与各类人才合作。我认为我们的使命也引起了有经验人士的共鸣。我只是认为我们的关键在于,我们想要那些不害怕改变范式、并能尝试想象新的事物运作方式的人。
我一直在琢磨的一件事是,最终的 AI 系统会有多大的不同?我很容易想象出像 Claude Opus 这样,性能只提高 20%,能力增加 20% 的模型。但如果它是全新的,就很难想象它会走向何方或最终结果是什么样的。
Asher: 我不知道你是否有幸与 GPT-4 基础模型交谈过,但它具有许多非常奇怪的涌现能力。例如,你可以拿你未发表的博客文章的一小段,然后问它,你认为这是谁写的,它就能认出来。
有很多这样的能力,模型在一些我们无法想象的方式上很智能。未来的模型将在更奇怪的方式上更智能。我认为我们应该期望未来会非常古怪,架构也会更加怪异。我们正在寻求数据效率方面 1000 倍的提升。我们不是在寻求渐进式的改变。因此,我们应该期望在极限情况下,出现同样不可知、异样的变化和能力。
Ben: 我大致同意这一点。只是我对这些东西最终将如何被世界体验到这一点上稍微持更温和的态度,就像 OpenAI 对 GPT-4 基础模型所做的那样。你想以不让消费者“直面深渊”的形式来呈现事物。我认为这很重要。但我大致同意,我们的研究议程是构建那些与当前能力根本上不同的能力。
太棒了!人们是否有方式可以与 Flapping Airplanes 互动?现在是否为时过早?还是他们应该关注研究和模型的发布?
Asher: 我们有一个邮箱 Hi@flappingairplanes.com。如果你只是想打个招呼。我们还有一个 disagree@flappingairplanes.com,如果你想表达不同意见。我们实际上进行了一些非常精彩的对话,人们会给我们发送非常长的文章,论证为什么我们正在做的事情是不可能的。我们很乐意与之交流。
Ben: 但他们还没有说服我们。到目前为止还没有人说服我们。
Asher: 第二点是,我们正在寻找致力于改变该领域、改变世界的杰出人才。所以如果你有兴趣,你应该联系我们。
Ben: 如果你有另一个非传统的背景,也没关系。你不需要两个博士学位。我们真的在寻找那些有不同想法的人。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区