目 录CONTENT

文章目录

使用Amazon Bedrock AgentCore Browser和Amazon Nova Act实现智能体式QA自动化

Administrator
2025-12-25 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/agentic-qa-automation-using-amazon-bedrock-agentcore-browser-and-amazon-nova-act/

原文作者:Kosti Vasilakakis, Omkar Nyalpelly, Ryan Canty, and Veda Raman


质量保证(QA)测试长期以来一直是软件开发的支柱,但传统的QA方法未能跟上现代开发周期和复杂用户界面的步伐。大多数组织仍然依赖于结合了人工测试和像Selenium、Cypress和Playwright这样的基于脚本的自动化框架的混合方法——然而,团队花费了大量的精力来维护现有测试自动化,而不是创建新的测试。问题在于,传统自动化非常脆弱。UI更改会导致测试脚本中断,需要专业的编程知识,并且通常在跨浏览器和设备方面覆盖不全。随着许多组织积极探索AI驱动的测试工作流程,当前的方法已显不足。

在本文中,我们将探讨智能体式QA自动化如何应对这些挑战,并通过使用 Amazon Bedrock AgentCore BrowserAmazon Nova Act 自动化一个零售应用程序的测试案例,来进行实践演示。

智能体式QA测试的优势

智能体式AI将QA测试从基于规则的自动化转变为智能的、自主的测试系统。与遵循预编程脚本的传统自动化不同,智能体式AI可以实时观察、学习、适应并做出决策。其关键优势包括通过UI观察进行自主测试生成和在UI元素变化时进行动态适应——从而最大限度地减少了消耗QA团队时间的维护开销。这些系统模仿了人类的交互模式,确保测试是从真实的用户视角而非僵硬的脚本化路径进行的。

用于大规模智能体式QA测试的AgentCore Browser

要在企业规模上实现智能体式AI测试的潜力,组织需要能够支持智能、自主测试智能体的强大基础设施。AgentCore Browser是 Amazon Bedrock AgentCore 的内置工具,它通过提供一个专为AI智能体与网站和应用程序交互而设计的安全、基于云的浏览器环境,来满足这一需求。

AgentCore Browser包含基本的企业安全功能,例如会话隔离、通过实时查看(live viewing)内置的可观察性、AWS CloudTrail 日志记录以及会话回放(session replay)功能。每个浏览器实例运行在容器化的临时环境中,使用完毕后可以关闭,从而提供干净的测试状态和最佳的资源管理。对于大规模QA操作,AgentCore Browser可以并发运行多个浏览器会话,因此组织可以同时跨不同场景、环境和用户旅程并行化测试。

使用Amazon Nova Act SDK进行智能体式QA

当AgentCore Browser的基础设施功能与像Amazon Nova Act这样的智能体SDK结合使用时,它们的能力会变得异常强大。Amazon Nova Act是一项AWS服务,可帮助开发人员构建、部署和管理可靠的AI智能体集群,用于自动化生产UI工作流程。使用此SDK,开发人员可以将复杂的测试工作流程分解为更小、更可靠的命令,同时在需要时仍能调用API和执行直接的浏览器操作。这种方法在整个测试过程中实现了Python代码的无缝集成。开发人员可以将测试、断点和断言直接插入智能体工作流程中,从而提供前所未有的控制和调试能力。AgentCore Browser云基础设施与Amazon Nova Act智能体SDK的结合,创建了一个全面的测试生态系统,彻底改变了组织处理质量保证的方式。

实践实施:零售应用测试

为了在实践中说明这种转变,我们考虑为一家零售公司开发一个新应用程序。我们创建了一个模拟零售Web应用程序来演示智能体式QA流程,假设该应用程序在开发和测试阶段托管在私有企业网络内的AWS基础设施上。

为了简化测试创建过程,我们使用 Kiro,一个AI驱动的编码助手,通过分析我们的应用程序代码库来自动生成UI测试用例。Kiro会检查应用程序结构,回顾现有的测试模式,并根据Amazon Nova Act所需的JSON模式格式创建全面的测试用例。通过了解应用程序的功能——包括导航、搜索、过滤和表单提交——Kiro会生成带有操作和预期结果的详细测试步骤,这些步骤可通过AgentCore Browser即时执行。这种AI辅助的方法极大地加速了测试创建,同时提供了全面的覆盖。下面的演示展示了Kiro为我们的QA测试演示应用程序生成了15个即用型测试用例。

Kiro generating test cases

测试用例生成后,它们被放置在 测试数据目录 中,pytest 会自动发现并执行它们。每个JSON测试文件都成为pytest可以并行运行的独立测试。该框架使用 pytest-xdist 将测试分配到多个工作进程中,自动利用可用的系统资源以达到最佳性能。

在执行期间,每个测试都通过Amazon Nova Act SDK获得自己的隔离的AgentCore Browser会话。Amazon Nova Act智能体会从JSON文件中读取测试步骤并执行它们——执行点击按钮或填写表单等操作,然后验证预期结果是否发生。这种数据驱动的方法意味着团队可以通过简单地编写JSON文件来创建全面的测试套件,而无需为每个测试场景编写Python代码。并行执行架构显著减少了测试时间。通常需要顺序运行的测试现在可以在多个浏览器会话中同时执行,由pytest管理结果的分发和聚合。使用 pytest-htmlpytest-html-nova-act 插件会自动生成一个HTML报告,提供测试结果、屏幕截图和执行日志,使测试过程完全透明。

AgentCore Browser最强大的功能之一是它能够并发运行多个浏览器会话,从而可以大规模实现真正的并行测试执行。当pytest将测试分配到工作进程时,每个测试都会在云中启动自己的隔离浏览器会话。这意味着您的整个测试套件可以同时执行,而不是等待每个测试顺序完成。

AWS管理控制台 提供了对这些并行会话的完全可见性。如以下视频所示,您可以实时查看正在并发运行的活动浏览器会话、监控其状态以及跟踪资源利用率。这种可观察性对于理解测试执行模式和优化测试基础设施至关重要。

除了仅监控会话状态之外,AgentCore Browser还提供实时视图会话回放功能,以便您可以确切地看到Amazon Nova Act在测试执行期间和之后正在执行的操作。对于活动的浏览器会话,您可以打开实时视图,实时观察智能体与您的应用程序交互——单击按钮、填写表单、导航页面和验证结果。当您启用会话回放时,您可以通过回放记录的会话来查看记录的事件。这使您能够在测试执行完成后验证测试结果。这些功能对于调试测试失败、理解智能体行为以及对自动化测试过程建立信心来说是无价的。

有关完整的部署说明以及对示例零售应用程序代码、AWS CloudFormation 模板和pytest测试框架的访问,请参阅随附的 GitHub 仓库。该仓库包含在您自己的AWS环境中部署和测试应用程序所需的组件。

结论

在本文中,我们探讨了AgentCore Browser如何帮助并行化Web应用程序的智能体式QA测试。像Amazon Nova Act这样的智能体可以高可靠地执行自动化智能体式QA测试


关于作者

Kosti Vasilakakis 是AWS智能体式AI团队的首席项目经理,他从头开始设计和开发了多个Bedrock AgentCore服务,包括Runtime、Browser、Code Interpreter和Identity。他之前曾在Amazon SageMaker早期工作,发布了目前被全球数千家公司使用的AI/ML功能。在他职业生涯的早期,Kosti是一名数据科学家。工作之余,他构建个人生产力自动化工具,打网球,并与妻子和孩子们一起享受生活。

Veda Raman 是AWS Amazon Nova和智能体式AI的高级解决方案架构师,专注于生成式AI。她帮助客户使用Amazon Nova模型和Bedrock AgentCore设计和构建智能体式AI解决方案。在此之前,她曾与客户合作构建使用Amazon SageMaker的ML解决方案,并在AWS担任无服务器解决方案架构师。

Omkar Nyalpelly 是AWS专业服务部门的云基础设施架构师,在AWS着陆区和DevOps方法论方面拥有深厚的专业知识。他目前的重点是云基础设施与AI技术的交叉点——特别是利用生成式AI和智能体式AI系统来构建自主、自管理的云环境。通过与企业客户的合作,Omkar探索创新的方法来减少运营开销,同时提高系统可靠性。在技术追求之余,他喜欢打板球、棒球和探索创意摄影。他拥有南卫理公会大学的网络与电信理学硕士学位。

Ryan Canty 是Amazon AGI Labs的解决方案架构师,拥有超过10年的软件工程经验,专注于跨多个技术栈设计和扩展企业软件系统。他与客户合作利用Amazon Nova Act(一项AWS服务,用于构建和部署高度可靠的AI智能体以大规模自动化基于UI的工作流程),弥合尖端AI能力与实际业务应用之间的差距。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区