📢 转载信息
原文作者:Marc Karp and Natasya K. Idries
构建能够处理复杂、真实世界任务的智能体可能会让人望而生畏。此外,组织通常不应仅依赖大型的预训练基础模型,而需要对更小、更专业的模型进行微调和定制,以使其在特定用例中超越基础模型。AWS AI League 提供了一个创新的项目,通过激动人心的竞赛来帮助企业克服构建高级 AI 功能的挑战,这些竞赛推动了智能体 AI 和模型定制领域的创新。
2025 年,首届 AWS AI League 竞赛吸引了全球的开发人员、数据科学家和业务领导者的关注。他们齐聚一堂,利用最新的 AI 工具和技术来解决紧迫的问题。在 AWS re:Invent 2025 上的总决赛精彩地展示了他们的创造力和技能。来自领先组织的跨职能团队进行了正面较量,展示了他们构建有效提示、微调模型和构建强大 AI 智能体的能力。
祝贺 2025 年 AWS AI League 冠军!在三位杰出构建者之间经过激烈竞争后,他们脱颖而出,分享了 25,000 美元的奖池:
- 第一名:来自思科 (Cisco) 的 Hemanth Vediyera
- 第二名:来自 Aqfer 的 Ross Williams
- 第三名:来自美国银行 (Capital One) 的 Deepesh Khanna
图 1:从左到右:Ross、Hemanth、Deepesh
本文探讨了如何利用 AWS AI League 项目来举办 AI 竞赛,帮助参与者体验模型定制和智能体构建概念,将其应用于解决现实世界的业务挑战,并通过引人入胜的游戏化形式展示他们的创新解决方案。我们重点介绍了新的智能体 AI 和模型定制挑战,企业可以申请使用 AWS 积分来举办内部锦标赛,开发人员也可以在 AWS 活动中进行竞争。
要开始使用,请访问 AWS AI League 产品页面。
什么是 AWS AI League 冠军赛?
AWS AI League 的体验始于由 AWS 专家主导的为期 2 小时的动手研讨会,随后是自定进度的实验。这段旅程的高潮是一场引人入胜的、类似游戏秀的总决赛,您可以在其中展示您的 AI 创建和解决方案,以应对紧迫的业务挑战。下图显示了这三个步骤。
图 2:AWS AI League 冠军赛步骤
在 2025 年项目的成功基础上,我们很高兴地宣布推出 AWS AI League 2026 冠军赛。今年,竞赛有两个新挑战,让参与者真正检验他们的 AI 技能:
- 智能体 AI 挑战赛允许您使用 Amazon Bedrock AgentCore 构建智能体。竞争者构建定制的智能体架构来解决现实世界的业务问题。
- 作为智能体 AI 挑战赛的补充,模型定制挑战赛现在使用 SageMaker Studio 中最新的微调配方。在这里,您为特定用例定制模型。
对于 2026 年 AI League 冠军赛,奖池翻倍至 50,000 美元,并为不同技能水平的开发人员——从初学者到高级实践者——设置了不同的赛道。
通过智能体 AI 挑战赛构建智能体
AWS AI League 现在推出了激动人心的智能体 AI 挑战赛,您可以使用 Amazon Bedrock AgentCore 来解决复杂问题,进行动态、游戏化的竞赛。在此挑战中,智能体在一个迷宫般的网格环境中导航,遇到各种挑战,同时寻找宝箱。这些挑战映射到现实世界的使用案例,测试智能体处理不当内容、执行代码、使用浏览器等的能力。
智能体有时间限制来穿越地图、收集积分并克服障碍,然后才能到达宝箱。获得的积分越多,他们在排行榜上的排名就越高。您可以使用 Amazon Bedrock AgentCore 的原始组件完全定制您的智能体,这使得您可以更安全地扩展和管理生产级智能体。您还可以为主管智能体和子智能体选择特定模型,并创建自定义工具,例如 Bedrock 护栏、AgentCore 内存以及 AWS Lambda 函数,以帮助您的智能体应对挑战。下图描绘了智能体在前往宝箱途中必须克服的障碍。
图 3:AWS AI League 智能体挑战赛
AWS AI League 为用户提供了一个完整的用户界面 (UI),用于构建其智能体解决方案。您可以使用这个无代码 UI 来构建多智能体架构和工具,整合各种组件,例如 Amazon SageMaker Studio CodeEditor,用于交互式编写自定义 Lambda 函数和工具代码。这使得您无需离开环境,即可在 AWS AI League 网站内完全开发和定制基于智能体的解决方案。
以下截图展示了完全在 AWS AI League 网站内的智能体构建体验。
图 4:AWS AI League 智能体工具
图 5:AWS AI League 多智能体架构
在整个竞赛过程中,用户会收到实时的智能体性能反馈,一个大型语言模型 (LLM) 评估器会提供评估以帮助迭代。下图展示了智能体在挑战中是如何被评估的。
图 6:AWS AI League 智能体挑战赛评估
在总决赛中,排名前列的决赛选手以现场游戏秀的形式展示他们智能体的能力,证明了智能体 AI 在解决复杂、多步骤问题方面的强大和多功能性。评估标准包括时间效率、解决挑战的准确性、智能体规划和 Token 消耗效率。下图展示了 re:Invent 2025 总决赛的最后一轮。
图 7:AWS AI League re:Invent 2025 总决赛
定制模型以超越更大的模型
AWS AI League 正在扩大其 模型定制挑战赛的范围,允许您使用最新的微调技术进展。
您可以在 Amazon SageMaker Studio 中访问新的模型定制体验,在那里您可以使用强大的新训练配方。目标是开发出高效的、特定领域的模型,其性能可以超越较大参考模型的性能。
挑战始于您磨练自己的模型定制技能。利用您学到的工具和技术,应用先进的微调方法来帮助提高模型的性能。在您的模型定制完成后,真正的考验就开始了。模型将被提交到排行榜上,根据性能与参考模型进行评估。每当自动化裁判认为您定制模型的响应比参考模型的输出更准确、更全面时,该模型就会获得积分。您可以展示您的高级技能,登上排行榜榜首,并可能为您的组织解锁新的机会。
在挑战期间,当您提交到排行榜时,您会从自动化评估器那里收到有关模型性能的实时反馈。排行榜会在整个竞赛过程中根据参考数据集评估提交结果,提供关于准确性的即时反馈,以帮助您迭代和改进解决方案。下图展示了如何使用 AI 评论来评估定制模型。
图 8:AWS AI League 模型定制评估
在总决赛中,顶尖的决赛选手以现场游戏秀的形式展示他们模型的各项能力,展示他们的提示工程技能。在游戏秀期间,评分包括专家评估,领域专家和现场观众实时投票,以确定哪些 AI 解决方案最能解决实际业务挑战。下图展示了总决赛期间的参与者提示工程视图。
图 9:AWS AI League 模型定制总决赛参与者视图
结论
在本文中,我们探讨了新的 AWS AI League 挑战赛以及它们如何改变组织处理 AI 开发的方式。在 AWS,我们了解到激发创新的最快方式是通过竞赛。借助 AWS AI League,构建者现在可以展示他们的 AI 技能、竞争并释放创新潜力。
要详细了解如何在组织内部举办 AWS AI League,请访问 AWS AI League,要深入了解构建智能体和定制 AI 模型,请探索 AWS Skill Builder 上的 AWS AI 培训目录。
作者简介
Marc Karp 是 Amazon SageMaker 服务团队的 ML 架构师。他专注于帮助客户大规模设计、部署和管理 ML 工作负载。在业余时间,他喜欢旅行和探索新的地方。
Natasya K. Idries 是 AWS AI/ML 游戏化学习计划的产品营销经理。她热衷于通过引人入胜的实践性教育计划来普及 AI/ML 技能,这些计划弥合了先进技术与实际业务实施之间的差距。她在构建学习社区和推动数字创新方面的专业知识,持续塑造她创建有影响力 AI 教育项目的方法。在工作之余,Natasya 喜欢旅行、烹饪东南亚美食和探索自然小径。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区