https://arxiv.org/abs/2409.05591
该论文的标题为《MEMORAG: 向记忆启发的知识发现移动的新一代RAG》。该论文由北京人工智能研究院和中国人民大学高瓴人工智能学院的研究人员撰写,提出了一种新的检索增强生成(RAG)框架,名为MemoRAG。MemoRAG的核心创新在于结合了长时记忆模型,以解决传统RAG在处理隐式信息需求和非结构化知识时的局限性。论文的主要贡献包括:
MemoRAG的基础是检索增强生成(RAG),其核心公式为:
其中, 表示生成模型, 表示检索模型, 为输入查询, 为从数据库 中检索出的上下文, 为最终生成的答案。在传统RAG中,检索模块主要依赖显式的查询匹配,难以处理隐式信息需求。
为解决这一问题,MemoRAG引入了记忆模块,通过轻量级的LLM(长上下文处理能力)生成初步的答案草稿。这一过程可以形式化为:
其中, 是通过记忆模块生成的中间答案草稿,作为检索的提示。记忆模型通过上下文压缩技术将数据库中大量的内容进行全局语义存储,并利用这些存储的提示信息进行进一步的精确检索。
在记忆模块中,MemoRAG使用了一种基于Transformer的注意力机制来实现语义压缩。每个上下文窗口生成少量记忆token,这些记忆token通过附加的权重矩阵进行处理,生成紧凑的全局语义表示,公式如下:
通过这种方式,MemoRAG能够在多个上下文窗口内逐步将短期记忆转换为长期记忆,并在需要时从这些长期记忆中提取关键线索。
该论文使用了一个名为ULTRADOMAIN的基准测试集,对MemoRAG进行了多方面的评估,测试涵盖了金融、法律、教育等多个领域的复杂任务。这些任务包括隐式查询、多步推理和信息聚合,传统RAG方法在这些任务上表现不佳。实验结果表明,MemoRAG在所有测试任务中均优于现有的RAG方法,特别是在长上下文和多步推理任务上。
例如,在处理金融报告时,MemoRAG可以从数十年的报告中形成全局记忆,并准确找到某一年份的峰值收入。而在多文档问答任务中,MemoRAG通过生成的线索,有效整合了跨文档的信息,实现了更高的问答精度。
MemoRAG突破了传统RAG的局限,能够处理更加复杂的隐式查询和长上下文任务。未来的研究方向可能包括:
总体而言,MemoRAG通过全局记忆和线索生成机制,显著提高了RAG在复杂任务中的性能,为构建智能知识发现系统提供了新的方向。
这张图展示了标准RAG(左侧)与MemoRAG(右侧)在处理复杂查询时的区别。
这展示了MemoRAG如何通过全局记忆和线索机制,显著提高复杂任务的性能。
本文作者:Dong
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 CC BY-NC。本作品采用《知识共享署名-非商业性使用 4.0 国际许可协议》进行许可。您可以在非商业用途下自由转载和修改,但必须注明出处并提供原作者链接。 许可协议。转载请注明出处!