从扁平化向量检索向多智能体层级架构的全面演进
| 当前局限性痛点 | 业务影响 | 升级解决方案 |
|---|---|---|
| 暴力切块与无分块 | 长文档检索精度极低,丢失语义边界 | 智能 Markdown 标题分块 |
| 单一检索模式 | 专有名词、精确匹配效果差 | 混合检索 (向量 + BM25 + Rerank) |
| 无意图识别中枢 | 无法区分"查定量数据"与"查定性政策" | 引入 Intent Router 与 Pandas Agent |
| 无源头追溯与评估 | 幻觉率高,企业场景不可靠,无法量化质量 | 前端引用定位 + Ragas 评估体系 |
场景:海量非结构化文本,规章制度、研究报告、新闻通稿查询。
架构:标准向量 RAG (双路召回策略)
场景:包含加减乘除、对比趋势、生成图表的复杂 Excel 报表或 SQL 库。
架构:Agentic Data Analysis (直接运行计算代码)
场景:数百页超大 PDF 主体,伴随若干零散补充文档。
架构:层级检索 (Hierarchical RAG) / Markdown 树状索引
场景:跨文档的历史演变、全行业综述、概念交织推演。
架构:知识图谱 RAG (GraphRAG)
用户提问
"2025 年环保政策对轻型商用车 (LCV) 销量的影响是什么?"
判断意图:QUERY_ANALYSIS (需要数据 + 政策)
提取实体:{"time": "2025 年", "policy": "环保", "metric": "销量"}
1. 挂载加载 LCV 销量表格
2. 计算同比/环比趋势
3. 提取定量下降数据 (-15%)
1. 检索预演池目录树
2. 精准定位"环保政策"特定章节
3. 仅加载 2-3 个核心 Chunk
"根据销量数据,2025 年 LCV 销量同比下降 15%。主要原因是环保政策中报废税上调(详见《环保法》§3.2 章节)..."
大堂经理必须在极短的时间内,决定把请求派发给哪些底层工具,防止"文不对题"。
拒绝混用!结构化走代码通道,非结构化走向量/预演池通道,双线齐发。
将两路甚至多路召回的结果进行逻辑自洽合并,生成最完美的"人话"。
数据来源:`Top LCV Sheet`; 政策依据:《环保法》3.2 节)。目标:实现"目录→章节→内容"的精准层级披露,解决扁平化带来的上下文断裂。
目标:引入双路召回与重排机制,大幅提升专有名词和边缘概念的检索命中率。
目标:彻底融合非结构化与结构化数据处理流,实现真正的智能协同。
目标:攻克跨文档的全局推演难题,并引入客观的自动化评测打分体系。
| 核心组件技术选型 | |
|---|---|
| 文档高保真解析 | 阿里云 dashscope |
| 核心 Embedding | text-embedding-v4 (1024 维) |
| Rerank 重排 | 阿里云 gte-rerank (后期切 BGE) |
| 意图识别路由 | DeepSeek V3 API |
| 数据/量化计算 | Python Pandas Agent + MCP |
| 底层数据库 | Supabase + pgvector 扩展 |
| 系统核心评估指标 (Metrics) | |
|---|---|
| 语境相关度 Context Relevance |
测算"黄金段落"检索命中率 |
| 事实忠实度 Faithfulness |
反向验证输出,拦截幻觉瞎编 |
| 回答切题度 Answer Relevance |
衡量回答是否直接解决用户诉求 |
| 结构化精准度 Logic Correctness |
对 Agent 执行过程的数字做断言校验 |
| Token 效能比 Token Efficiency |
测算单次优质回答的 API 消耗成本 |