# Research 对标 Deep Research 的改造方案、实施 PRD 与当前落地状态

> 文档性质：Research 产品改造与实施方案 + 实施同步文档。
>
> 更新日期：2026-03-13。
>
> 当前状态：P0 已完成，P1 核心能力已完成，P2 / P3 未开始。
>
> 目标：参考 OpenAI ChatGPT 的 Deep Research 产品模式，结合当前系统已具备的 ES 混合检索、知识图谱、QA、Research 工作台能力，将现有 Research 从“增强版研究问答”升级为“任务驱动的深度研究工作台”。

---

## 1. 结论摘要

当前系统中的 Research 在原始方案提出时，已经具备以下基础：

- 多会话研究工作台
- 显式资料导入与 `seed_doc_ids`
- ES 混合检索 + 图谱补充
- SSE 流式输出
- 引用文档列表与图谱摘要

当时它仍然更接近“研究型长回答”，而不是 ChatGPT Deep Research 那种“任务编排 + 过程可见 + 中间产物沉淀 + 结构化报告输出”的深度研究代理。

因此，Research 的下一阶段改造方向不应只是“继续优化答案质量”，而应升级为以下产品形态：

- 从单一输入框升级为研究任务定义
- 从一次性回答升级为分阶段研究流程
- 从引用列表升级为证据工作区
- 从 Markdown 长文本升级为结构化研究报告
- 从消息历史升级为研究资产沉淀

截至 2026-03-13，上述改造已经完成第一轮落地，Research 已具备以下能力：

- 任务定义表单、模板化预置、研究深度与输出模板选择
- 先生成计划、再确认执行的双阶段工作流
- 结构化 SSE 事件流和研究进度时间线
- 执行摘要、关键发现、章节化报告、冲突、待确认问题、一页式摘要等结构化输出
- 证据工作区第一版，支持按显式资料 / 混合检索 / 图谱补证沉淀证据
- 服务端章节重跑和“转成新任务”两类继续研究路径
- Markdown、Word 兼容 `.doc`、正式汇报版 `.doc` 导出
- Search / QA / 文档详情 / 事项详情 到 Research 的统一导入链路

但与目标态相比，仍有以下缺口：

- 还没有后端研究会话 / 产物查询 API
- 还没有证据 pin / exclude / 人工取舍接口
- 证据状态预警、版本失效提醒仍是一版能力
- 订阅刷新、对比研究、协作评审仍未开始

建议将本 PRD 视为“已完成一轮实施后的路线图”，按以下状态理解各项优先级：

| 优先级 | 改造项 | 当前状态 | 主要价值 |
|--------|--------|----------|----------|
| P0 | 研究任务定义表单 | 已完成 | 让 Research 与 QA 角色分离，明确研究边界 |
| P0 | 研究计划确认 | 已完成 | 增强过程可控性，避免直接输出大段黑盒答案 |
| P0 | 扩展 SSE 事件与进度流 | 已完成 | 让研究过程可见、可解释、可分阶段呈现 |
| P0 | 章节级结构化报告输出 | 已完成 | 让输出更像报告而不是聊天记录 |
| P0 | 证据工作区 | 已完成（第一版） | 强化证据管理、引用理解与材料沉淀 |
| P0 | 冲突与缺口提示 | 已完成（第一版） | 提升可靠性，避免“看起来完整但依据不足” |
| P1 | 模板化研究模式 | 已完成 | 提高不同研究场景下的稳定性与效率 |
| P1 | 中间发现、笔记与待确认问题 | 已完成 | 沉淀研究过程，而不是只保留最终答案 |
| P1 | 证据分组、证据强弱与人工取舍 | 部分完成 | 更接近人工研究过程 |
| P1 | 报告导出与一页式摘要 | 已完成 | 直接服务汇报和材料生产 |
| P1 | 章节重跑与针对性补检索 | 已完成 | 让研究结果可迭代而非一次性固定 |
| P2 | 研究监控、订阅与定期刷新 | 未开始 | 支持专题持续跟踪 |
| P2 | 对比研究与差异分析 | 未开始 | 支持新旧政策、区域、部门横向比较 |
| P2 | 协作评审与批注 | 未开始 | 支持多角色共同打磨研究结果 |
| P3 | 外部数据接入与公网搜索 | 暂不建议 | 与当前政务内部文档主价值不一致 |
| P3 | 条款级证据回链与合规审查 | 未开始 | 依赖 Article 与条款级图谱能力 |

---

## 2. 当前现状与主要差距

## 2.1 当前已具备能力

基于当前实现，Research 已具备：

- 多会话工作台与本地持久化
- 资料篮导入、详情页导入与显式研究范围控制
- 研究任务定义表单，支持模式、模板、深度、主题、问题、目标、范围等字段
- `plan -> run` 的双阶段深度研究流程
- 基于 SSE 的结构化事件流与研究进度时间线
- 执行摘要、关键发现、章节化报告、冲突、待确认问题、一页式摘要
- 证据工作区第一版，支持显式资料 / 检索命中 / 图谱补证的证据沉淀
- Markdown、Word 兼容 `.doc`、正式汇报版 `.doc` 导出
- 服务端章节重跑与“转成新任务”继续深挖

这些能力已经足以支撑“任务驱动的深度研究工作台”第一版，但仍未达到 Deep Research 的完整产品形态。

## 2.2 与 Deep Research 的主要差距

| 维度 | 当前状态 | Deep Research 目标状态 | 差距判断 |
|------|----------|------------------------|----------|
| 输入方式 | 已支持任务定义表单 + 显式资料范围 | 任务定义 + 约束 + 输出目标 | 差距低 |
| 研究开始前规划 | 已支持显式计划生成与确认 | 先给研究计划，再执行 | 差距低 |
| 过程可见性 | 已有进度流、发现、章节、冲突、待确认项 | 有子任务、进度、补检索、汇总过程 | 差距中 |
| 输出形态 | 已为章节化、结构化报告 | 章节化、结构化报告 | 差距低 |
| 引用呈现 | 已有证据工作区第一版和来源分组 | 证据工作区、证据分组、证据强弱、人工取舍 | 差距中 |
| 冲突识别 | 已显式提示冲突、缺口、待确认项 | 显式提示冲突、证据不足、待确认项 | 差距中 |
| 中间产物 | 已有计划、发现、开放问题、笔记 | 计划、发现、开放问题、笔记、产物 API | 差距中 |
| 可迭代性 | 已支持章节重跑和转成新任务 | 可重跑章节、补充证据、继续研究 | 差距低 |
| 报告复用 | 已支持导出与本地会话沉淀 | 保留研究资产、导出、汇报摘要、后端产物查询 | 差距中 |
| 模板化场景 | 已有基础预置模板 | 不同研究类型有不同任务模板 | 差距中 |

---

## 3. 改造目标

Research 下一阶段的目标不应是“更像聊天”，而应是“更像研究工作台”。

目标能力可以概括为五层：

1. 任务定义层
2. 研究编排层
3. 证据管理层
4. 报告生成层
5. 研究资产层

### 3.1 任务定义层

用户不是只输入一个问题，而是明确：

- 研究主题
- 研究目标
- 时间范围
- 地域范围
- 部门范围
- 必须纳入的文档或事项
- 期望输出格式
- 研究深度等级

### 3.2 研究编排层

系统不应直接回答，而应先：

- 拆解子问题
- 形成研究计划
- 分步检索和图谱补证
- 汇总证据
- 生成章节
- 标记冲突与待确认项

### 3.3 证据管理层

研究输出不能只靠结论，需要有：

- 证据分组
- 证据优先级
- 直接依据与背景依据区分
- 证据冲突提示
- 证据是否已失效或修订提醒

### 3.4 报告生成层

输出应固定为结构化报告，而不是长聊天文本，至少支持：

- 结论摘要
- 关键发现
- 时间演进
- 依据链
- 相关事项
- 风险与争议点
- 开放问题
- 引用附录

### 3.5 研究资产层

研究会话应沉淀的不只是消息，而应包括：

- 研究任务描述
- 研究计划
- 研究发现
- 章节结果
- 证据集
- 开放问题
- 导出版本

---

## 4. 优先级总表

## 4.1 P0 必须调整项

这些不是“锦上添花”，而是让 Research 开始接近 Deep Research 的必要改造。

| 编号 | 改造项 | 类型 | 优先级 | 当前状态 | 原因 |
|------|--------|------|--------|----------|------|
| DR-P0-01 | 研究任务定义表单 | 调整 | P0 | 已完成 | 让 Research 从问题输入升级为任务输入 |
| DR-P0-02 | 研究计划确认 | 新增 | P0 | 已完成 | 让研究过程可控、可解释 |
| DR-P0-03 | 扩展 SSE 事件模型 | 调整 | P0 | 已完成 | 支撑计划、进度、发现、章节等流式呈现 |
| DR-P0-04 | 章节级结构化报告 | 调整 | P0 | 已完成 | 让结果更适合汇报和复用 |
| DR-P0-05 | 证据工作区 | 调整 | P0 | 已完成（第一版） | 引用要从列表升级为工作区 |
| DR-P0-06 | 冲突与缺口提示 | 新增 | P0 | 已完成（第一版） | 显式标注依据不足和冲突信息 |

## 4.2 P1 强化项

这些能力会显著丰富体验，但不一定是第一批必须完成的。

| 编号 | 改造项 | 类型 | 优先级 | 当前状态 | 主要价值 |
|------|--------|------|--------|----------|----------|
| DR-P1-01 | 模板化研究模式 | 新增 | P1 | 已完成 | 提升不同场景下的稳定性 |
| DR-P1-02 | 中间发现、笔记与待确认问题 | 新增 | P1 | 已完成 | 沉淀研究过程和思考脉络 |
| DR-P1-03 | 证据分组与证据强弱标记 | 新增 | P1 | 部分完成 | 帮助用户理解“为何得出此结论” |
| DR-P1-04 | 报告导出与一页式摘要 | 新增 | P1 | 已完成 | 直接服务汇报与材料产出 |
| DR-P1-05 | 章节重跑与补充检索 | 新增 | P1 | 已完成 | 让研究结果能局部迭代 |
| DR-P1-06 | 推荐追问与后续研究方向 | 新增 | P1 | 已完成 | 将研究转化为下一步行动 |

## 4.3 P2 丰富项

这些能力适合在 Research 主框架稳定后推进。

| 编号 | 改造项 | 类型 | 优先级 | 当前状态 | 主要价值 |
|------|--------|------|--------|----------|----------|
| DR-P2-01 | 研究订阅与定期刷新 | 新增 | P2 | 未开始 | 支持专题持续跟踪 |
| DR-P2-02 | 新旧政策对比研究 | 新增 | P2 | 未开始 | 支持差异分析 |
| DR-P2-03 | 区域 / 部门横向比较 | 新增 | P2 | 未开始 | 支持横向洞察 |
| DR-P2-04 | 协作评审与批注 | 新增 | P2 | 未开始 | 支持多人共研 |
| DR-P2-05 | 研究模板市场化扩展 | 新增 | P2 | 未开始 | 支持更多业务部门复用 |

## 4.4 P3 后续阶段项

这些能力不是当前阶段的合理重点。

| 编号 | 改造项 | 类型 | 优先级 | 当前状态 | 说明 |
|------|--------|------|--------|----------|------|
| DR-P3-01 | 外部数据与公网检索 | 新增 | P3 | 暂不建议 | 当前系统价值主轴仍是内部公文和图谱 |
| DR-P3-02 | 条款级证据回链 | 新增 | P3 | 未开始 | 需依赖 Phase 2 条款图 |
| DR-P3-03 | 条款级合规审查 | 新增 | P3 | 未开始 | 需依赖条款级语义关系 |

---

## 5. P0 改造与实施方案

### 5.0 当前落地情况（2026-03-13）

截至当前版本，DR-P0-01 至 DR-P0-06 已全部完成第一轮落地：

- 前端 `/research` 已改造成“左侧会话 + 中部任务/计划/报告 + 右侧证据工作区”的三栏工作台。
- 前端已支持研究任务定义、计划确认、研究执行、章节重跑、导出和笔记沉淀。
- 后端已提供 `POST /api/v1/research/plan`、`POST /api/v1/research/run`、`POST /api/v1/research/sections/rerun`。
- `ResearchEngine` 已具备 `build_plan(...)`、`run_deep_research(...)`、`rerun_section(...)` 三类核心能力。
- P0 剩余待补内容主要不是“是否有”，而是“是否继续细化”，例如更强的规则检测和更细粒度证据治理。

## 5.1 DR-P0-01 研究任务定义表单

### 现状问题

当前 Research 入口主要是单输入框提问，适合问答，不适合深度研究任务定义。

### 调整目标

将输入从“问题”升级为“研究任务”，至少支持：

- 研究主题
- 研究目标
- 时间范围
- 地域范围
- 部门范围
- 必须纳入资料
- 输出模板
- 研究深度等级

### 前端改造建议

新增组件：

- `ResearchTaskForm`
- `ResearchTemplateSelect`

建议在 `/research` 页面顶部增加任务定义模式切换：

- 快速研究
- 深度研究

### 后端改造建议

扩展请求结构或新增接口：

- `POST /api/v1/research/plan`

建议请求体字段：

- `goal`
- `question`
- `time_range`
- `region_scope`
- `org_scope`
- `required_doc_ids`
- `required_matter_ids`
- `output_template`
- `depth_level`

### 验收标准

- 用户可定义研究边界，而不只是抛出一个问题。
- 表单内容可作为研究计划的输入。

---

## 5.2 DR-P0-02 研究计划确认

### 现状问题

当前系统直接进入检索和生成，没有显式研究计划。

### 新增目标

在正式运行前，先生成一版研究计划，供用户确认。

研究计划至少应包含：

- 研究目标重述
- 子问题拆解
- 预计检索方向
- 预计章节结构
- 已明确纳入的显式资料

### 前端改造建议

在 Research 主面板新增“计划确认区”，支持：

- 查看计划
- 调整计划
- 确认执行

### 后端改造建议

新增接口：

- `POST /api/v1/research/plan`
- `POST /api/v1/research/run`

其中：

- `plan` 负责产出研究计划
- `run` 负责按已确认计划执行研究

### 验收标准

- 系统能先给计划，再开始深度研究。
- 用户可以理解系统将如何展开研究。

---

## 5.3 DR-P0-03 扩展 SSE 事件模型

### 现状问题

当前 SSE 事件类型过少，只适合流式文本输出，不适合研究工作流。

### 新增目标

将事件模型扩展为研究过程协议。

### 建议事件类型

当前已有：

- `thinking`
- `text`
- `reference`
- `graph`
- `done`
- `error`

建议新增：

- `plan`
- `progress`
- `finding`
- `conflict`
- `section`
- `open_question`
- `source_group`

### 前端改造建议

Research 主界面新增：

- 研究进度时间线
- 子任务进度面板
- 实时发现卡片

### 后端改造建议

改造 `ResearchChunk` 协议，使其支持章节和发现类事件，而不是只承载 token 文本。

### 验收标准

- 用户能看见研究过程，不再只是等待答案生成。
- 研究各阶段状态可以独立展示。

---

## 5.4 DR-P0-04 章节级结构化报告输出

### 现状问题

当前 Research 输出更像长文本回答，不利于汇报和复用。

### 调整目标

默认输出结构化报告，至少包含以下章节：

- 结论摘要
- 关键发现
- 时间演进
- 依据链
- 相关事项
- 风险与争议点
- 待确认问题
- 引用附录

### 前端改造建议

在主输出区采用章节卡片，而不是单块聊天消息。

支持：

- 展开 / 折叠章节
- 单独复制章节
- 单独重跑章节

### 后端改造建议

研究引擎从一次性长答案生成改为：

- 分章节生成
- 分章节流式返回
- 每个章节可带对应证据列表

### 验收标准

- 输出结果更像研究报告而不是聊天记录。
- 章节结构稳定，可用于导出。

---

## 5.5 DR-P0-05 证据工作区

### 现状问题

当前右侧引用区更像文档列表，而不是研究中的证据工作区。

### 调整目标

将“引用文档”升级为“证据工作区”，至少支持：

- 核心证据
- 背景证据
- 显式导入资料
- 图谱证据
- 被排除证据

### 前端改造建议

右侧栏拆为三个标签：

- 证据
- 导入资料
- 冲突 / 缺口

证据卡建议展示：

- 标题
- 文号
- 证据类型
- 与哪一章节相关
- 是否为核心依据
- 是否存在修订 / 失效风险

### 后端改造建议

在检索结果和生成阶段为证据打上标签：

- `evidence_type`
- `section_keys`
- `is_core`
- `source_origin`
- `status_warning`

### 验收标准

- 用户能理解每篇文档在研究中的角色。
- 引用从“列表”升级为“可管理证据集”。

---

## 5.6 DR-P0-06 冲突与缺口提示

### 现状问题

当前研究结果缺少“材料不足”和“口径冲突”的显式提醒。

### 新增目标

系统应主动识别并标注：

- 版本冲突
- 地域适用范围冲突
- 部门口径冲突
- 依据链不完整
- 当前资料不足以得出结论

### 前端改造建议

新增“冲突 / 缺口”卡片区，位于主输出区顶部或右侧栏。

### 后端改造建议

在生成阶段和证据归并阶段增加冲突检测逻辑，至少先做规则优先版本：

- 文档状态冲突
- 同主题文件结论冲突
- 依据链缺口

### 验收标准

- 系统不再默认输出“看起来完整”的结论。
- 用户能明确看到需要人工确认的点。

---

## 6. P1 强化与丰富能力

### 6.0 当前落地情况（2026-03-13）

截至当前版本，P1 核心能力已经基本落地：

- 已实现模板化研究模式，当前内置“政策链条梳理”“执行研判”“阶段演进”等预置。
- 已实现关键发现、研究笔记、待确认问题、建议后续方向等中间产物沉淀。
- 已实现 Markdown、完整报告 Word 兼容 `.doc`、正式汇报版 `.doc` 导出，以及一页式摘要复制。
- 已实现服务端章节重跑，且保留“转成新任务”作为继续深挖的兜底路径。
- 证据分组和发现强弱标签已落地，但更细的 `evidence_type`、`is_core`、`status_warning`、人工 pin / exclude 仍待补。

## 6.1 DR-P1-01 模板化研究模式

当前已内置的模板化研究预置包括：

- 政策脉络梳理
- 执行研判
- 阶段演进

后续可继续补充：

- 事项办理研究
- 部门职责研究
- 新政影响评估
- 汇报简报

每种模板可控制：

- 默认章节结构
- 默认检索偏好
- 默认图谱补证方向

---

## 6.2 DR-P1-02 中间发现、笔记与待确认问题

当前已支持：

- 关键发现卡片
- 用户笔记
- 待确认问题列表
- 建议后续研究方向

这样会话沉淀的就不是单纯问答，而是真正的研究记录。后续仍可继续增强人工批注和显式待办管理。

---

## 6.3 DR-P1-03 证据分组与证据强弱标记

当前已支持：

- 按来源分组（显式纳入资料 / 混合检索命中 / 图谱补证）
- 关键发现强弱标记

后续建议继续支持：

- 按章节分组
- 按主题分组
- 按事项分组
- 按证据强弱分组

并继续增加证据标签：

- 直接依据
- 背景依据
- 结构化推断依据
- 需谨慎使用

---

## 6.4 DR-P1-04 报告导出与一页式摘要

当前已支持：

- 导出 Markdown
- 导出 Word 兼容 `.doc`
- 导出正式汇报版 `.doc`
- 复制一页式摘要

这是 Deep Research 非常重要的落地能力，因为研究结果最终要进入材料链路。若后续需要更强排版控制，可再补原生 `.docx` 导出。

---

## 6.5 DR-P1-05 章节重跑与补充检索

当前已支持：

- 服务端章节局部重跑
- 将章节转成新任务继续深挖

后续仍可继续补充“追加材料后只重跑本节”“针对特定证据类型补检索”等细化能力。这能大幅提升研究可迭代性，而不是每次都全文重跑。

---

## 6.6 DR-P1-06 推荐追问与后续研究方向

当前已支持自动给出：

- 待确认问题
- 建议后续研究方向

后续可继续补充：

- 值得纳入的补充资料
- 可切换到 QA 深问的局部问题

---

## 7. P2 后续丰富方向

## 7.1 DR-P2-01 研究订阅与定期刷新

适用于长期专题：

- 每周自动刷新一次研究结果
- 新文件进入主题后提醒
- 版本链变化后提醒

这需要研究任务持久化和定时调度。

---

## 7.2 DR-P2-02 新旧政策对比研究

建议支持：

- 同主题新旧文件对比
- 不同年份政策对比
- 不同地区同类政策对比

这类能力对决策支持很有价值，但不属于第一批必做项。

---

## 7.3 DR-P2-03 区域 / 部门横向比较

建议支持：

- 不同地区对同主题的政策覆盖比较
- 不同部门职责划分比较
- 同事项在不同地区的办理口径比较

---

## 7.4 DR-P2-04 协作评审与批注

建议支持：

- 会话分享
- 章节批注
- 审核意见
- 研究版本比对

这会让 Research 从个人工具变成团队工作台。

---

## 8. 明确不建议当前阶段照搬的能力

以下能力不建议作为当前阶段的重点：

1. 公网网页自动抓取。
2. 面向开放互联网的广域检索代理。
3. 自动审批或自动结论裁定。
4. 条款级证据回链和条款级合规审查。

原因：

- 当前系统的主价值在于内部政务文档、治理链、事项图谱，而不是外部网页浏览。
- 当前更应优先把研究流程做成可解释、可复用、可导出的内部研究工作台。

---

## 9. 接口与协议改造（含当前落地状态）

## 9.1 当前已实现接口与后续建议

当前已实现接口：

- `POST /api/v1/research`
- `POST /api/v1/research/plan`
- `POST /api/v1/research/run`
- `POST /api/v1/research/sections/rerun`

后续建议继续补充：

- `GET /api/v1/research/sessions/{session_id}`
- `GET /api/v1/research/sessions/{session_id}/artifacts`
- `POST /api/v1/research/sessions/{session_id}/evidence/pin`
- `POST /api/v1/research/sessions/{session_id}/evidence/exclude`

说明：

- 当前章节重跑接口已经落地，但还没有采用 session-scoped REST 资源形态。
- 当前研究会话主要由前端 `research-sessions-v2` 本地持久化承载，后端尚未提供研究资产查询 API。

## 9.2 建议扩展 SSE 事件协议

当前已实现的事件类型主要包括：

- `plan`
- `progress`
- `summary`
- `finding`
- `reference`
- `conflict`
- `section`
- `open_question`
- `report`
- `follow_up`
- `done`
- `error`

当前实现说明：

- `reference` 事件的 `payload` 中已经带有 `source_group` / `source_label`，前端据此完成证据分组。
- 兼容旧链路的 `thinking` / `text` 仍可保留，但深度研究主路径已经以结构化事件为主。

后续建议优先补充：

1. 将 `source_group`、`status_warning`、`evidence_type` 等证据元信息从隐式 payload 继续提升为更稳定协议。
2. 增加更细粒度的章节 patch / rerun 状态事件，便于局部重跑时做更细致的 UI 反馈。

---

## 10. 前端改造建议

## 10.1 页面结构改造

当前 `/research` 已从“聊天布局”升级为工作台结构，实际落地形态为：

1. 左侧：会话与研究任务
2. 中间：任务定义、计划确认、章节化报告
3. 右侧：证据工作区 / 导入资料
4. 中右辅助区：研究进度、冲突缺口、研究笔记
5. 顶部：导出、重命名、导入、清空、侧栏切换

## 10.2 建议新增组件

当前已实际复用或落地的前端模块：

- `ResearchView.vue`
- `researchStore`
- `frontend/src/api/research.ts`
- `CitationCard.vue`
- `MarkdownRenderer.vue`

后续如需继续降复杂度，可进一步抽离：

- `ResearchTaskForm`
- `ResearchPlanPanel`
- `ResearchProgressTimeline`
- `ResearchSectionCard`
- `EvidenceWorkspace`
- `ConflictAlertPanel`
- `OpenQuestionPanel`
- `ResearchExportDialog`

## 10.3 Store 改造建议

当前 `researchStore` 已落地并持久化以下核心状态：

- `sessions`
- `sessionId`
- `task`
- `plan`
- `report`
- `progress`
- `references`
- `notes`
- `importedItems`
- `isPlanning`
- `isRunning`
- `planIsFresh`

当前本地持久化 key 为 `research-sessions-v2`，并兼容旧数据迁移。

---

## 11. 后端改造建议

## 11.1 引擎形态改造

当前后端已经完成第一轮“研究编排引擎”改造，核心能力为：

1. `build_plan(...)`：任务理解、目标重述、子问题拆解、检索重点与章节骨架生成
2. `run_deep_research(...)`：多轮检索、图谱补证、结构化报告事件流输出
3. `rerun_section(...)`：按章节上下文和既有证据做局部重跑

后续仍可继续增强的方向：

1. 更显式的子任务调度与补检索轮次记录
2. 更规则化的冲突检测和证据状态判断
3. 研究资产持久化与查询 API

## 11.2 持久化模型改造

当前状态：

- 前端已对结构化研究会话做本地持久化。
- 后端请求链路已支持 `session_id`，但还没有完整的研究会话 / 研究产物读取接口。

后续建议至少新增：

- 任务元信息
- 已确认计划
- 章节结果
- 证据集
- 冲突项
- 待确认问题
- 导出产物元信息

## 11.3 规则优先能力

建议优先采用规则 + 检索 + 图谱的方式做以下能力，而不是完全依赖 LLM：

- 文档版本冲突识别
- 依据链缺口识别
- 同主题文件状态冲突识别
- 研究模板章节骨架生成

当前实现中，冲突与缺口已经能在报告层显式呈现，但独立规则引擎和文档状态预警仍属于下一步强化方向。

---

## 12. 分阶段实施路线

## 12.1 Release DR-1：从问答升级到任务

目标：先把 Research 输入和开始阶段改对。

当前状态：已完成。

范围：

- 研究任务定义表单
- 研究计划确认
- 基础 `plan` / `progress` SSE 事件

出口标准：

- 用户可以先定义研究任务，再确认计划，再开始执行。

## 12.2 Release DR-2：从长答案升级到结构化研究

目标：让 Research 输出不再像聊天，而像报告。

当前状态：已完成。

范围：

- 章节级报告输出
- 章节卡片 UI
- 证据工作区第一版
- 冲突与缺口提示第一版

出口标准：

- 用户可以看到章节化报告、对应证据和冲突提醒。

## 12.3 Release DR-3：从结果展示升级到研究资产

目标：沉淀中间产物和可复用结果。

当前状态：核心能力已完成，产物 API 与人工证据治理仍待补。

范围：

- 中间发现与待确认问题
- 证据分组与人工取舍
- 导出与一页式摘要
- 章节重跑与补检索

出口标准：

- 研究过程和结果都可复用、可导出、可继续迭代。

## 12.4 Release DR-4：从个人工具升级到持续研究平台

目标：支撑长期专题和团队使用。

当前状态：未开始。

范围：

- 研究订阅
- 定期刷新
- 对比研究
- 协作评审

出口标准：

- Research 能支撑专题持续跟踪和多人共研。

## 12.5 当前验证结果

截至 2026-03-13，当前落地版本已经完成以下验证：

- 后端 Research 相关测试切片通过，`backend/tests/test_api_research.py` 与 `backend/tests/test_research_engine_unit.py` 合计 `16 passed`。
- 前端编译校验通过，当前可靠校验命令为 `npx vite build`。
- Search / QA / 文档详情 / 事项详情 到 Research 的导入链路已完成静态核验。
- README、进度文档、测试说明已同步到当前实现状态。

## 12.6 审查后修正与实现约束

在首轮 Deep Research 改造完成后，又根据代码审查结果补充了一轮稳定性和可维护性修正，当前状态如下：

### 已完成修正

- 修复前端会话状态展示兜底：`statusMeta` 已增加 fallback，且 store 在 hydration 时会对持久化的 `status` 做归一化，避免异常本地数据导致页面状态标签渲染出错。
- 修复 `researchStore` 的 hydration guard：`hydrateSession()` 结束后延迟释放 `hydrating` 标记，避免会话恢复时触发不必要的 `syncCurrentSession()` 和本地重复持久化。
- 修复右侧证据工作区滚动链路：`evidence-panel` 与 Tabs 内容区已补齐 flex / min-height 约束，长证据列表和导入资料列表现在可以稳定滚动。
- 优化研究执行中的空白体验：当 `isRunning === true` 且报告尚未返回首批内容时，主报告区会显示显式 loading 提示，而不再呈现空白容器。
- 明确 Word 导出语义：前端文案已调整为 `.doc` 兼容导出，避免把 HTML-based `.doc` 误解为原生 `.docx`。
- 补齐后端结构化事件单测：`test_research_engine_run_deep_research_emits_structured_events()` 现在显式断言 `conflict` 和 `open_question` 事件发射。

### 本轮收敛后的实现约定

- 研究计划阶段仍会通过 `seed_doc_ids` 传递“显式导入资料”，用于计划生成和 `plan.included_doc_ids` 的归并。
- 深度研究执行和章节重跑阶段，显式文档范围现在以 `plan.included_doc_ids` 为唯一主来源；前端不再在 run / rerun 请求体里重复传输同一批导入文档。
- 后端 `ResearchEngine` 已统一通过显式文档范围解析 helper 收敛 run / rerun 的 scope 逻辑，保留对旧 `seed_doc_ids` 调用链的兼容回退。
- 前端 Markdown 渲染基础配置已集中到共享工具模块，`MarkdownRenderer` 与导出 HTML 逻辑都基于同一套 MarkdownIt 工厂创建实例，避免配置继续分叉。

### 当前仍保留为后续优化项

- 小屏幕下左右侧栏仍采用直接隐藏策略，尚未升级为 Drawer 模式。
- Word 导出仍是 Word-compatible `.doc`，若后续对排版保真度有更高要求，再单独引入原生 `.docx` 生成方案。

---

## 13. 最终建议

原始 PRD 中最关键的六项 P0 能力已经全部落地。

下一阶段不应再重复建设“有没有计划 / 有没有结构化报告 / 能不能重跑”，而应重点补齐以下四类能力：

1. 研究会话与研究产物的后端查询 / 持久化 API
2. 证据 pin / exclude / `status_warning` / `evidence_type` 等细粒度证据治理
3. 浏览器级 smoke / 导出链路实测和更系统的前端回归验证
4. 订阅刷新、对比研究、协作评审等 P2 能力

当前版本已经完成从“增强版研究问答”到“任务驱动的深度研究工作台”第一阶段升级。

在此基础上，再逐步补齐研究资产 API、证据治理、持续监控和协作能力，才能进一步接近 Deep Research 的完整产品形态。