企业级 RAG 与多智能体架构选型

面向复杂数据环境的系统架构演进与 MediaAgent 落地指南

📄

1. 纯文本聚合检索

场景:海量非结构化文本,规章制度、研究报告、新闻通稿查询。

架构:标准向量 RAG (双路召回策略)

ChromaDB FastGPT
📊

2. 结构化数据智能体

场景:包含加减乘除、对比趋势、生成图表的复杂 Excel 报表或 SQL 库。

架构:Agentic Data Analysis (直接运行计算代码)

Pandas Agent DeepSeek V3
🌳

3. "一超多强"层级文档

场景:数百页超大 PDF 主体,伴随若干零散补充文档。

架构:层级检索 (Hierarchical RAG) / Markdown 树状索引

Markdown 切分 全局缓存预演池
🕸️

4. 海量强关联文档网络

场景:跨文档的历史演变、全行业综述、概念交织推演。

架构:知识图谱 RAG (GraphRAG)

LightRAG 社区摘要发现

🚦 核心引擎:智能中枢路由 (Router) 架构解析

🔍 1. 意图感知层
⚙️ 2. 专家执行层
🧠 3. 聚合反思层

Intent Router:精准判断用户的“真实需求”

大堂经理必须在极短的时间内,决定把请求派发给哪些底层工具,防止“文不对题”。

🎯 核心处理逻辑

  • 语义分类 (Semantic Routing):利用轻量级 LLM 快速识别输入特征(是查数值、查政策、还是写报告?)。
  • UI 降维干预:不要过度神化 AI。在前端提供【📊 数据分析】和【📚 文献检阅】等快捷切换开关,让人类意图辅助系统分发,准确率可飙升至 99%。
  • 实体提取:提前抓取“时间(2025)”、“对象(Avtovaz)”等关键词,作为传给底层 Agent 的硬约束。

💻 用户输入模拟

"结合最近发布的新能源政策,算一下 10 月份轻型商用车 (LCV) 的销量跌了多少?" > 解析结果 (JSON): { "tasks": ["query_policy", "calc_sales_drop"], "entities": {"time": "10月", "category": "LCV"} }

Expert Agents:多线程并行的底层数据处理

拒绝混用!结构化走代码通道,非结构化走向量/预演池通道,双线齐发。

📊 [工具 A] Data Agent (定量)

  • 职责:挂载本地 Excel/SQL 权限。
  • 动作:直接生成 Python 或 SQL 代码执行运算。
  • 防御机制:内置异常捕获(如列名不匹配、遇到 `Value` 脏数据),大模型自主修代码重试。

📚 [工具 B] Doc Agent (定性)

  • 职责:处理上百页的 PDF 或 Word 长文。
  • 动作:通过读取 Markdown 预演池(全局目录) 快速定位相关章节,精准提取原文文本。
  • 优势:避免了将整本手册强行打碎造成的上下文丢失。

Synthesizer:防幻觉的最终质检员

将两路甚至多路召回的结果进行逻辑自洽合并,生成最完美的“人话”。

🛡️ 最终输出与安全控制

  • 交叉验证 (Cross-check):核对 Data Agent 给出的“下降15%”是否与 Doc Agent 找出的“政策导致销量遇冷”逻辑相符。如果矛盾,触发警报。
  • 生成引文追踪:要求输出必须带来源标签(例如:数据来源: Top LCV Sheet; 政策依据: 《环保法》 3.2节)。
  • 降级策略:如果 Data Agent 代码执行失败,系统不乱猜数字,而是优雅降级:“已查到相关政策,但销量数据计算失败,请检查 Excel 格式。”

✨ 最终合成报告示例

【结论】10月份 LCV 市场销量下降 15%。 【原因分析】 根据《新能源政策文件》[3.2 环保与报废税章节],10月份起报废税大幅上调,这是导致该细分市场销量断崖式下跌(-15%)的核心政策原因。 [注:数据源自 `Sales_Data.xlsx`,依据检索自 `Meta-TOC 缓存`]

⚖️ 各引擎选型综合评估矩阵

评估维度 场景 1: 纯文本 (Vector) 场景 2: 结构化 (Agent) 场景 3: 一大一小 (Hierarchy) 场景 4: 强关联 (Graph)
精准度 (Accuracy)
事实忠实度及召回率
中等 (易漏边缘信息) 极高 (确定性计算) 较高 (章节逻辑连贯) 最高 (全局推理防幻觉)
Token 消耗 (Cost)
API 调用与建库成本
极低 (仅匹配碎片) 中 (受限于试错重试) 极低 (命中目录缓存) 极高 (大模型通读建图)
响应速度 (Speed)
用户端感知延迟
极快 (毫秒级检索) 中/慢 (代码执行延迟) 最快 (逐级递进查询) 中 (图谱节点遍历)
工程落地门槛
框架成熟度与开发难度
门槛低 (生态极度完善) 中 (需治理脏数据拦截) 中等 (需重写解析规则) 门槛最高 (涉及图数据库)

🎯 核心战略设计 (Takeaways)