首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP
行动起来,活在当下
累计撰写
319
篇文章
累计创建
207
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
SWE-Bench
相关的文章
2025-10-16
Anthropic 性价比之王:Haiku 4.5 重磅发布,以三分之一价格实现 Sonnet 4 级编程能力
Anthropic 宣布推出新型小型 AI 模型 Claude Haiku 4.5,旨在为实时、低延迟任务提供卓越的性价比。Haiku 4.5 在成本上仅为 Sonnet 4 的三分之一,而编程能力却能与其媲美,并在速度上快了两倍。该模型在 SWE-bench 权威测试中得分 73.3%,接近 GPT-5 表现。此外,Anthropic 还设计了创新的多模型协同工作流,利用 Haiku 4.5 执行分解后的子任务,极大地提升了复杂任务处理的效率和成本效益,预示着新一代 AI 代理应用的巨大潜力。
2025-10-16
2
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2025-10-15
超越74.6%!京东云JoyCode-Agent荣登SWE-Bench全球榜单Top 3,并已开源
京东云旗下的JoyCode-Agent在权威SWE-Bench Verified基准测试中表现出色,以74.6%的惊人通过率位列全球前三。这一成绩不仅展示了其解决复杂编程问题的强大能力,更是在计算成本降低30%-50%的前提下实现的,极具性价比。该智能编码产品正式在GitHub开源,采用了多智能体协作、端到端自动修复闭环以及精细化失败归因机制,旨在为企业级严肃开发场景提供高效、低成本的AI编程解决方案。
2025-10-15
1
0
0
AI基础/开发
AI工具应用