📢 转载信息
原文作者:Hien Luu
谷歌发布了 Gemini CLI 扩展(Gemini CLI Extensions),这是一个开源框架,允许开发者为 Gemini CLI 代理 构建和共享集成。该框架使用“剧本”(playbooks)——结构化的指令,帮助AI与外部工具(如数据库、CI/CD系统和API)进行交互。借助包括Dynatrace、Elastic、Figma、Shopify和Stripe在内的合作伙伴提供的社区 扩展目录,这个新框架旨在使Gemini CLI成为一个以可扩展的、AI辅助的开发者工作流为中心的枢纽。
该扩展框架通过模块化架构,在Gemini CLI现有能力的基础上进行了构建。每个扩展都包含一个内置的“剧本”,为AI提供了关于如何使用已连接工具的即时知识,从而消除了复杂的设置要求。该框架支持单个扩展内的多个组件:一个或多个用于外部工具连接的MCP服务器、用于提供模型指令的上下文文件(如GEMINI.md
)、用于禁用内置功能的排除工具(excluded tools),以及用于复杂提示的自定义斜杠命令(slash commands)。
来源:扩展的解剖结构
扩展通过增加智能层来增强模型上下文协议(Model Context Protocol,MCP),这些智能层超越了原始的工具连接能力。虽然MCP提供了基本的工具访问权限,但Gemini CLI扩展将此功能用上下文感知和个性化执行进行了封装。系统会查阅扩展剧本并评估环境上下文(如本地文件和Git状态),从而根据开发者的意图执行适当的工具。
在发布时,谷歌重点展示了一个包含一/二方集成的开放生态系统。初始合作伙伴涵盖了关键的开发领域,包括可观察性和数据分析(Dynatrace、Elastic)、设计(Figma)、安全(Snyk)、CI/CD(Harness)以及API工具(Postman、Stripe)。谷歌的一方扩展支持关键类别:云基础设施(Cloud Run、GKE)、应用开发(代码审查、Flutter、Firebase)以及数据/AI(BigQuery、Cloud SQL、Looker),展示了其在开发者整个工作流程中的实用性。谷歌强调,任何人都可以构建和发布扩展,鼓励在商业产品之外进行内部工具开发和社区贡献。
该框架将Gemini CLI定位为一个开放生态系统的中心,任何开发者都可以在其中构建集成。谷歌启动了一个专门的扩展页面,其中按GitHub流行度对可用扩展进行了编目。公司为有兴趣创建和分享自定义扩展的开发者提供了 模板 和 分步指南,从而能够实现个人工作流优化和企业内部工具集成。
社区的反应:
一位用户分享道:
我非常喜欢它,这里有无限的潜力,我们才刚刚开始!伙计们干得太棒了!
一位用户问道:
这与“子代理子句代码”(clause code subagents)有何不同?
另一位用户回答道:
啊,与子代理非常不同。可以将扩展视为一种将一组功能捆绑在简单安装下的方式。这可以是一个或多个MCP服务器、命令、关于如何(以及何时)利用这些MCP服务器的指令以及其他许多东西。一旦Gemini CLI在未来启动其子代理支持,你可以肯定它也会在扩展中落地!
谷歌的Gemini CLI扩展进入了一个竞争激烈的环境,其他AI驱动的编码助手CLI工具也在发展其可扩展性方法。Claude Code通过模型上下文协议(MCP)支持可扩展性,通过斜杠命令、代理、MCP服务器和钩子提供定制化,Anthropic最近还引入了一个 插件系统,使用户可以共享自定义设置。然而,OpenAI的Codex CLI和GitHub Copilot CLI目前都没有提供可比拟的扩展框架或第三方集成市场,这使得谷歌基于目录的方法在AI驱动的CLI领域成为一个显著的特色。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区