📢 转载信息
原文链接:https://www.qbitai.com/2025/10/341385.html
原文作者:量子位
全面领先三大权威基准
将复杂科研过程自动化落地,上海人工智能实验室(Shanghai AI Lab)推出了FlowSearch!
在GAIA、HLE、GPQA以及TRQA等科研基准上,FlowSearch不仅实现了性能全面领先,还展示了AI在复杂科研任务中的动态协作与深度推理能力。

展开来说,当AI在问答基准和标准化测试中表现卓越之时,其进行科学研究的能力也在被更多关注。
科学研究不同于解题或信息检索,它是一个开放性、长期且复杂的认知过程——研究者需要提出原创问题、设计实验方案、收集并整合多源证据,并在不断迭代中形成系统结论。
这样的过程远超计算能力本身,它要求的是创新思维、动态推理能力以及对复杂知识关系的精准掌控。
而FlowSearch,正是一个由动态结构化知识流驱动的深度科研智能体。
它通过动态结构化知识流构建科研任务的多层依赖图,并在多智能体框架下实现任务的并行探索、知识的递归整合和流程的自适应优化。
与传统“输入—计算—输出”的封闭式AI不同,FlowSearch更像一个理解你研究思路的伙伴——当发现新信息,它会主动调整计划;当证据链不完整,它会引导进一步探索;当推理偏离目标,它会进行自我修正。
研究团队表示,它标志着科研智能体从“被动工具”迈向主动探索伙伴的新阶段,让科学发现不再只是等待AI输出结果,而是与AI一起探索、不断前进。
FlowSearch:让AI成为你的科研探索伙伴
FlowSearch由三大核心模块组成,每个模块都像科研团队中的“关键成员”,协同完成复杂任务:
1、Knowledge Flow Planner:规划研究路线,像科学家一样拆解问题、逐层细化制定任务;
2、Knowledge Collector:执行任务、收集信息,就像勤奋的实验助理一样整理数据;
3、Knowledge Flow Refiner:反思和优化整个研究流程,确保科研思路清晰、连贯、可持续。
当你提出研究问题时,FlowSearch先由Planner构建初步的知识流——每个节点代表一个子问题或关键概念,节点之间的连接描绘了知识依赖关系。
随后,多名“智能体”同时开始执行任务,Collector不断填充节点内容,而Refiner会根据中间结果动态调整流程——增删任务、优化依赖,让科研路径像有生命一样逐步演化。

动态结构化知识流:科研的逻辑网络
FlowSearch使用有向无环图把科研任务和知识关系可视化。每个节点都携带任务类型(检索、求解、回答)、描述和知识上下文,而节点间的边定义了信息流向。
这种设计让科研推理不再依赖线性顺序,而能同时展开多条探索路径,每一步都可追踪和验证。
换句话说,它不仅让 AI 能“想清楚每一步”,也让你能随时理解科研过程的脉络。
递归式知识流规划:逐层拆解科研问题
高质量的科研规划源于逐层细化的专家式思维。Planner模块采用递归扩展策略——从总问题出发,识别每一层需要细化的子任务,生成新的节点和依赖关系。
这一过程持续进行,直到形成完整的初始知识流。FlowSearch中的InternPlanner模型经过结构化科研任务数据微调,能够学习专家的拆解方式,让AI的规划既逻辑清晰,又稳健可靠。
知识采集与动态反思:让科研像“活”起来
Knowledge Collector执行任务、收集信息,并把结果整理成节点知识,为后续推理提供输入。
任务执行完成后,Knowledge Flow Refiner会启动反思机制:它能根据新信息调整节点和依赖关系,优化任务顺序,确保知识流持续进化。
这意味着FlowSearch不只是一个执行工具,它具备自组织、自纠错、自优化能力,可以在复杂科研任务中保持全局一致性,同时灵活应对局部变化。
以上设计让FlowSearch同时具备:
- 层次化分解能力:仿佛每个科研问题都能被拆解到最合适的颗粒度;
- 多路并行探索能力:智能体可以同时处理多个任务,提高效率;
- 全局收敛能力:动态调整确保最终知识流完整、逻辑自洽。
无论是复杂跨学科研究,还是大规模数据分析,FlowSearch都能让科研不再只是“等待AI输出”,而是真正的与AI共同探索。
实验结果与分析
1、综合性能突破
FlowSearch在三大权威基准GAIA、GPQA-diamond、HLE上,全面超越现有方法。

在生物领域的专业基准TRQA上,FlowSearch依托通用工具链超越了多个领域专用模型,显示出强大的专业问题解决能力。

2、模块有效性验证
去除动态知识流建模或反思模块均导致显著性能下降,验证了结构化规划与动态调整机制在提升推理深度与系统稳定性方面的关键价值。

3、Internplanner模型训练效果
经过微调的Internplanner-32B相比基础模型Qwen-3-32B在GAIA上提升约6个百分点,表明结构化知识训练能够显著增强模型的规划能力与任务一致性。

4、案例分析
通过FlowSearch与OWL的对比案例可以看出,FlowSearch通过显式依赖建模与中间结果整合,有效避免了证据丢失与逻辑链断裂,展现出更高的推理透明度与可解释性。

同时,FlowSearch不仅能够高质量地完成科研问答任务,还能直接适配于科学调研与报告生成任务,产出完整、全面且逻辑清晰的科学调研成果。
应用前景与科研影响
团队表示,FlowSearch的提出标志着科研智能体从“任务执行”向“知识驱动推理”的关键转变。
- 对于科研新人,它能够构建完整的知识探索路径,降低进入新领域的学习门槛;
- 对跨学科研究者,它提供了知识流整合与多模态信息融合能力;
- 对资深学者,它可作为智能研究助手,在假设生成、证据聚合和报告撰写阶段显著提升效率。
更重要的是,FlowSearch的动态结构化框架为未来可解释科研智能体与自演化科学发现系统奠定了通用基础——使智能体具备类研究者的思考、探索与自我反思能力,推动人工智能从工具向真正的科研伙伴演进。
论文链接:https://arxiv.org/abs/2510.08521
GitHub仓库:https://github.com/Alpha-Innovator/InternAgent
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
青云聚合API官网https://api.qingyuntop.top
支持全球最新300+模型:https://api.qingyuntop.top/pricing
详细的调用教程及文档:https://api.qingyuntop.top/about
评论区