近日,清华大学 THUNLP 实验室、东北大学 NEUIR 实验室与 OpenBMB 及 AI9Stars 联合发布了 UltraRAG2.0,这是首个基于 Model Context Protocol(MCP)架构设计的检索增强生成(RAG)框架。
该框架致力于简化 RAG 系统的构建过程,使科研人员可以在短时间内实现复杂的多阶段推理系统。UltraRAG2.0的亮点在于用户只需通过编写 YAML 文件,即可轻松声明复杂的逻辑,如串行、循环和条件分支,从而显著减少代码量,降低实现的门槛。
在当前的 RAG 发展趋势中,许多系统逐渐融入了自适应知识组织、多轮推理及动态检索等复杂特性,代表项目包括 DeepResearch 和 Search-o1。然而,这些复杂特性也给开发者带来了高昂的工程成本,制约了新想法的快速迭代与复现。UltraRAG2.0应运而生,它通过将 RAG 的核心组件封装为独立的 MCP 服务器,实现了功能的灵活调用和扩展。
具体而言,与以往的实现方式相比,UltraRAG2.0在代码量上大幅减少。例如,经典方法 IRCoT 的官方实现需要近900行代码,而使用 UltraRAG2.0只需约50行代码就能完成同等功能。其中一半的代码是用于流程编排的 YAML 伪代码,极大降低了开发门槛。框架支持通过简洁的声明式方式来构建多阶段推理流程,使得复杂的推理逻辑不再需要冗长的手动编码。
UltraRAG2.0还支持动态检索、条件判断及多轮交互等高级功能,科研人员可以在短时间内搭建出高性能的实验平台,满足复杂多跳问题的需求。其性能较传统的 Vanilla RAG 提升约12%。该系统的设计旨在让研究者在工程实现方面节省时间和精力,将更多的注意力放在算法创新和实验设计上。
此外,UltraRAG2.0的 MCP 架构允许不同模块间的无缝复用,并支持模块的灵活扩展和接入,方便科研人员快速适配新的模型和算法。这一设计极大提升了系统开发的效率和可复现性。
GitHub:https://github.com/OpenBMB/UltraRAG
项目主页:https://openbmb.github.io/UltraRAG
划重点: