目 录CONTENT

文章目录

OpenAI前高管的“神秘”AI实验室推出首款重磅产品:Tinker,开启模型微调新纪元

青云TOP
2025-10-03 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/thinking-machines-lab-first-product-fine-tune/

原文作者:Will Knight / WIRED


OpenAI前高管的低调AI实验室发布重磅首款产品Tinker

由多位重量级OpenAI研究人员联合创办、并获得巨额资金支持的初创公司Thinking Machines Lab,正式揭晓了其首款产品——一款名为Tinker的工具,它旨在实现前沿AI模型的定制化创建自动化。

Thinking Machines联合创始人兼首席执行官Mira Murati在接受WIRED采访时表示:“我们相信Tinker将帮助研究人员和开发者进行模型实验,使前沿能力对所有人来说都更加易于获取。”

目前,大型科技公司和学术实验室已经习惯于对开源AI模型进行微调(fine-tuning),以创建针对特定任务(如解决数学题、起草法律文件或回答医疗问题)进行优化的新模型变体。

Tinker的颠覆性:让模型微调触手可及

通常情况下,这项工作需要获取和管理大量的GPU集群,并使用各种复杂的软件工具来确保大规模训练的稳定性和效率。而Tinker的承诺是,通过自动化大部分繁琐的工作,让更多的企业、研究人员甚至业余爱好者也能进行自己的AI模型微调。

本质上,该团队押注于:帮助人们微调前沿模型将是AI领域的下一个热点。考虑到Thinking Machines Lab的核心团队曾深度参与ChatGPT的创建,并且根据我与测试者的交流,Tinker比市场上同类工具更强大、更易于上手,这个判断很有可能是正确的。

Murati表示,Thinking Machines Lab希望揭开世界上最强大AI模型训练工作的神秘面纱,让更多人能够探索AI的极限。“我们正在把原本属于前沿领域的能力开放给所有人,这完全是颠覆性的,”她说。“外面有无数的聪明人,我们需要尽可能多的聪明人为前沿AI研究做出贡献。”

Tinker目前支持用户对Meta的Llama和阿里的Qwen两个开源模型进行微调。用户只需通过几行代码调用Tinker的API,即可通过监督学习(使用带标签数据调整模型)或日益流行的强化学习(根据输出给予积极或消极反馈来调整模型)开始微调。完成后,用户可以下载他们微调好的模型,并在任何地方运行。

业界正密切关注这次发布,部分原因就在于其团队的卓越背景。

幕后英雄:OpenAI的顶尖人才汇聚

Murati曾是OpenAI的首席技术官(CTO),并在2023年底董事会罢免Sam Altman后短暂担任过CEO。大约10个月后,她宣布离开该公司。

Murati与其他几位OpenAI的资深人士共同创立了Thinking Machines Lab,其中包括OpenAI联合创始人John Schulman;前研究副总裁Barret Zoph;从事安全和机器人研究的Lilian Weng;从事预训练和推理的Andrew Tulloch;以及后训练专家Luke Metz。在宣布任何产品之前,该团队就已吸引了巨大关注:去年7月,该初创公司宣布获得了高达20亿美元的种子轮融资,估值达到惊人的120亿美元。

Schulman曾主导了通过强化学习微调驱动ChatGPT的大型语言模型的工作。来自人类测试者的反馈提供了奖励信号,使模型在进行连贯对话、准确回答问题和避免不良行为方面变得更好(尽管仍不完美)。他声称,Tinker将利用强化学习和其他训练技巧,让更多人更容易地从大型模型中激发新能力。“这里有一些‘秘密魔法’,但我们让人们完全控制了训练循环,”Schulman告诉WIRED。“我们抽象掉了分布式训练的细节,但仍然让人们完全控制数据和算法。”

Thinking Machines Lab从周三开始接受用户申请Tinker的访问权限。目前该公司不对其API收费,但预计未来会开始收费。

部分Beta测试用户已经获得了API的试用权限,其中包括Redwood Research的研究员Eric Gan,该公司专注于AI模型的潜在风险。Gan表示他正在利用Tinker的强化学习功能来微调模型,使其能够编写代码中的后门。

Tinker的优势与开放性承诺

Gan表示,Tinker使得“挤出”模型中那些仅通过API无法展示的能力成为可能。他指出,微调过程中的调整相对容易。“Tinker绝对比从头开始做RL简单得多,”Gan说,并补充道:“如果你有一个非常专业化的任务,而现有模型无法完成,那么RL尤其擅长。”

另一位Beta测试者、专注于管理大规模AI项目的Anyscale公司CEO Robert Nishihara表示,虽然市场上已经存在VERL和SkyRL等其他微调工具,但Tinker提供了抽象性和可调性的惊人组合。“我认为这是一个很棒的API,很多人都会想用它,”他说。

对开源模型的一种持续担忧是它们可能被恶意下载和修改。Thinking Machines目前会对获得API访问权限的用户进行审查,但Schulman表示公司最终将引入自动化系统来防范滥用。

Tinker可能是Thinking Machines Lab的首款产品,但该公司已经发布了关于模型训练的基础研究,包括关于保持神经网络性能更高效地微调大型语言模型的进展,这些都被其在Tinker的幕后所利用。

该公司开放大型模型微调流程的计划,也体现了一种对开放性的承诺,这与当前大多数美国AI公司将最佳模型保持封闭、仅通过API访问的趋势形成了鲜明对比。目前,中国拥有比美国更多的开源前沿AI模型,并被全球许多公司和研究人员所使用。

Murati希望Tinker能帮助扭转商业AI模型日益封闭的趋势。“如果你考虑一下前沿实验室正在做什么,以及世界各地学术界其他聪明人正在做什么,他们的发展方向正变得越来越分化,”她说。“如果你认为这些强大的系统是如何进入世界的,那么这种分化对我们是不利的。”




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。

0

评论区