目 录CONTENT

文章目录

OpenAI前高管神秘创办“思维机器实验室”,发布首款AI模型微调工具Tinker

青云TOP
2025-10-04 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/thinking-machines-lab-first-product-fine-tune/

原文作者:Will Knight


OpenAI前高管的秘密AI实验室推出首款重磅产品:Tinker

由一群来自OpenAI的知名研究人员联合创立、并获得巨额资金支持的初创公司Thinking Machines Lab,正式公布了其首款产品——一个名为Tinker的工具,该工具旨在实现前沿AI模型的定制化创建和微调。

Thinking Machines的联合创始人兼首席执行官Mira Murati在接受WIRED采访时表示:“我们相信[Tinker]将帮助赋能研究人员和开发者进行模型实验,并使前沿能力对所有人来说更具可及性。”

Tinker:让模型微调触手可及

目前,大型科技公司和学术机构通常需要复杂的硬件资源(如GPU集群)和专业软件来对开源AI模型进行微调,以优化其在特定任务上的表现,例如解决数学问题、起草法律文件或回答医疗咨询。

Tinker的出现承诺通过自动化大部分繁琐工作,让更多的企业、研究人员甚至业余爱好者也能轻松微调他们自己的AI模型。

本质上,Thinking Machines团队押注于:帮助用户微调前沿模型将是AI领域的下一个重大趋势。考虑到Thinking Machines Lab的核心团队曾深度参与ChatGPT的创建,以及Beta测试用户反馈Tinker比市场上同类工具更强大、更友好,这一判断不无道理。

SAN FRANCISCO CALIFORNIA DECEMBER 03 Mira Murati Technologist speaks onstage during New Beginnings A Conversation with...

Mira Murati,Thinking Machines Lab 创始人。图片来源:WIRED 员工;Kimberly White;Getty Images

Murati表示,Thinking Machines Lab希望揭开调优世界最强大AI模型所涉及工作的神秘面纱,让更多人探索AI的极限。“我们正在让原本是前沿的能力普惠化,这完全是颠覆性的,”她说。“外面有太多聪明人,我们需要尽可能多的聪明人来进行前沿AI研究。”

技术核心:强化学习与开源模型支持

Tinker目前支持用户微调Meta的Llama和阿里的Qwen两大开源模型。用户可以通过几行代码调用Tinker的API,并通过监督学习(使用标记数据调整模型)或日益流行的强化学习(通过输出的正面或负面反馈来调整模型)进行微调。完成后,用户可以下载微调后的模型并在任何地方运行。

明星团队与巨额融资背景

AI行业对此次发布密切关注,很大程度上是因为其团队的资历深厚。

Murati曾是OpenAI的首席技术官(CTO),并在2023年底萨姆·奥特曼(Sam Altman)被董事会罢免后短暂担任了CEO。大约10个月后,她宣布离开该公司。

Murati与一众OpenAI元老共同创立了Thinking Machines Lab,其中包括OpenAI联合创始人John Schulman;前研究副总裁Barret Zoph;从事安全和机器人研究的Lilian Weng;从事预训练和推理的Andrew Tulloch;以及一个专注于后训练的专家Luke Metz。在宣布任何产品之前,该团队就已备受瞩目:去年7月,这家初创公司宣布已筹集了惊人的20亿美元种子资金,估值高达120亿美元。

Schulman曾负责通过强化学习微调驱动ChatGPT的大型语言模型。人类测试者的反馈提供了奖励信号,使模型在保持连贯对话、准确回答问题和避免不良行为方面得到了极大改善。

Schulman声称,Tinker将使更多人能够利用强化学习和其他训练技巧,从大型模型中激发新能力。“我们让人们完全控制训练循环,”Schulman告诉WIRED。“我们抽象掉了分布式训练的细节,但我们仍然让人们完全控制数据和算法。”

开放性承诺与未来展望

Thinking Machines Lab将从本周三开始接受Tinker的访问申请。目前API是免费的,但公司预计最终会开始收费。

部分Beta用户已经开始使用该API,其中包括专注于AI模型风险的Redwood Research的研究员Eric Gan。他表示,他正在利用Tinker的强化学习功能来微调模型以编写代码后门。

Gan表示,Tinker使得调优模型时能够激发一些仅通过API调用难以发现的能力,并且可以轻松调整微调参数。“与从头开始做RL相比,Tinker绝对要简单得多,”Gan指出。“对于非常专业的任务,且现有模型无法完成时,RL尤其有效。”

另一位Beta测试者、Anyscale(一家提供大规模AI项目管理技术的公司)的CEO Robert Nishihara表示,尽管市面上存在VERL和SkyRL等微调工具,但Tinker提供了抽象化和可调谐性的出色结合。“我认为它是一个很棒的API,很多人都会想用它。”

开源模型的一个挥之不去的问题是它们可能被恶意下载和修改。Thinking Machines目前会对API访问者进行审查,但Schulman表示,公司最终将引入自动化系统来防范滥用。

Tinker或许是Thinking Machines Lab的第一款产品,但该公司已经发布了关于模型训练的基础研究,包括如何保持神经网络性能更有效地微调大型语言模型的进展,这些都为Tinker背后的工具提供了支持。

该公司旨在开放大型模型调优流程的计划,也体现了在大多数美国AI公司将其最佳模型作为闭源、仅通过API访问的背景下,对开放性的承诺。目前,中国拥有的前沿开源AI模型比美国多,并且这些模型正被全球许多公司和研究人员使用。

Murati表示,她希望Tinker能帮助扭转商业AI模型日益封闭的趋势。“如果你考虑一下前沿实验室正在做的事情,以及学术界其他聪明人在做什么,你会发现他们正在逐渐分道扬镳,”她说。“如果你认为这些强大的系统是如何进入世界的,那么这种趋势并不理想。”

更新 10/03/25 下午1:45 ET:本文已更新,以澄清Thinking Machines Lab联合创始人John Schulman的引述内容。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。

0

评论区