目 录CONTENT

文章目录

Anthropic的技能如何让Claude更快、更便宜、更稳定

Administrator
2025-10-21 / 0 评论 / 0 点赞 / 1 阅读 / 0 字

📢 转载信息

原文链接:https://venturebeat.com/ai/how-anthropics-skills-make-claude-faster-cheaper-and-more-consistent-for

原文作者:Kyle Wiggers


Anthropic正在通过一种名为“技能(Skills)”的新方法,使其Claude大型语言模型(LLM)更快、更便宜、更一致。这项功能允许AI在执行特定任务时,不必每次都调用整个大型模型,从而提高效率并降低成本。

Anthropic的技能本质上是微调(fine-tuned)的模型,它们被设计用来处理特定的、重复性的任务。这种方法与传统上使用一个大型通用模型处理所有请求的模式形成对比。

Anthropic的研究科学家Jacob Steinhardt在最近的一次采访中解释了这种方法的优势。他提到,当用户需要模型执行特定类型的任务时,例如摘要或分类,而不是通用、开放式的聊天时,技能就变得非常有用。

“如果我们有一个你想要执行的特定任务,比如你想要一个模型来做某件事情,但这个任务是重复的,并且你想要它在很多方面都表现出色,那么我们就可以训练一个较小的模型来专门做这件事,”Steinhardt说。“这会使它更快、更便宜,并且更稳定。”

这项技术的引入,在很大程度上解决了使用大型基础模型时固有的某些效率低下问题。大型模型如Claude 2拥有数千亿参数,每次调用都需要大量的计算资源。当任务范围缩小后,使用通用模型就像“用大炮打蚊子”。

Anthropic的技能为开发者提供了一种混合范式:对于复杂的、创造性的或开放式的查询,仍然使用强大的Claude模型;而对于结构化、重复性的任务,则切换到针对性更强的“技能”模型。

技能如何提升一致性?

除了速度和成本效益之外,一致性是技能带来的另一个关键优势。大型模型在处理相同提示时可能会产生稍微不同的输出,这对于需要高度可预测结果的商业应用来说是一个问题。

“如果你用Claude 2问同样的问题两次,你可能会得到稍微不同的答案,”Steinhardt解释说。“但是,如果你训练了一个专门用于该任务的技能模型,那么它的输出就会非常一致。”

这种可预测性对于依赖自动化工作流程的企业至关重要。如果一个AI系统需要持续地从文档中提取数据,输出格式和准确性的波动是不可接受的。

技术实现与影响

虽然Anthropic尚未详细说明技能的确切技术细节(例如它们是基于Claude的蒸馏版本还是全新的架构),但其核心理念是任务分解专业化。这与当前AI领域对MoE(Mixture of Experts,专家混合)架构的兴趣相呼应,尽管技能可能采取更简单或更直接的微调实现。

Steinhardt承认,开发这些技能需要额外的工程工作和数据准备,但对于高频、低延迟或高精度的应用场景,这些初始投入是值得的。

关键优势总结:

  • 速度提升:较小的模型推理速度更快。
  • 成本降低:减少了调用大型模型所需的计算量。
  • 一致性增强:专业化训练确保了重复任务输出的稳定性。

Anthropic将这些技能视为Claude生态系统的一个补充层,旨在使AI能力更具成本效益和商业可用性。随着更多企业将LLM集成到关键业务流程中,这种专业化和效率的追求将成为LLM部署的关键趋势之一。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区