📢 转载信息
原文链接:https://www.ithome.com/0/890/120.htm
原文作者:故渊
苹果AI赋能开发测试:三大核心技术革新软件质量工程
IT之家 10 月 17 日消息,据科技媒体 Appleinsider 报道,苹果公司近日公布了三项前沿的 AI 研究成果,深入展示了如何运用人工智能(AI)和大语言模型(LLM)来提高软件开发和测试的效率。这些研究致力于自动化质量保证(QE)测试、自动修复代码错误,以及提前预测软件缺陷,旨在克服传统手动测试中耗时、成本高昂且容易出错的挑战。
一、Agentic RAG 框架:自动化测试的效率革命
第一个研究提出了一个“智能体 RAG 框架”(Agentic RAG Framework),专为软件自动化测试设计。
在传统开发流程中,质量工程师通常需要将 30% 至 40% 的时间用于手动编写测试方案和脚本。为了解决这一低效问题,苹果构建了一个由六个专业 AI 智能体组成的协同系统,它们分别负责法规遵从性分析、历史案例回顾、以及测试用例生成等关键任务。

该框架取得了惊人的成效:测试准确率从 65% 大幅提升至 94.8%,测试所需时间缩短了 85%,同时 BUG 检测率也提高了 35%。
二、SWE-Gym:训练 AI 解决真实工程难题
第二项研究发布了一个名为“SWE-Gym”的训练环境,专门用于培养 AI 智能体解决实际软件工程问题的能力。
该环境集成了来自 11 个知名 Python 代码库的 2438 个真实 GitHub 问题,允许 AI 在模拟环境中学习如何诊断和修复错误。

经过训练,基于语言模型的 AI 智能体成功完成了 72.5% 的编程任务。这项工作为提升开发人员的生产力提供了新的思路,并探索了未来“人机协作”编程的新模式。
三、ADE-QVAET:实现 BUG 的事前主动预防
第三项研究则聚焦于软件 BUG 的“事前预测”,并为此开发了名为“ADE-QVAET”的 AI 模型。

该模型融合了自适应优化技术(ADE)与量子变分自动编码器(QVAET),通过深度学习和模式识别技术,能够精准定位高维特征中的异常情况。
这项研究的目标是将软件维护从“被动修复”转变为“主动预防”,从而从根本上提升软件的整体质量。
IT之家附上参考地址:
-
Agentic RAG for Software Testing with Hybrid Vector-Graph and Multi-Agent Orchestration
-
Training Software Engineering Agents and Verifiers with SWE-Gym
-
Software Defect Prediction using Autoencoder Transformer Model
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区