# 知识库模块

> 📍 企业级 AI 驱动的智能知识库管理系统

> **模块位置**: `frontend/src/app/(modules)/knowledge-base/` + `backend/src/modules/knowledge-base/`
> **技术栈**: NestJS + Prisma + RAGFlow + OpenAI/DashScope + ProseMirror

## 实现状态

| 功能 | 状态 | 说明 |
|------|------|------|
| **检索引擎** | ✅ 完成 | RAGFlow 集成 |
| **RAG 问答** | ✅ 完成 | 多 LLM 支持 |
| **语义搜索** | ✅ 完成 | 混合搜索 |
| **SharePoint 同步** | ✅ 完成 | Graph API 集成 |
| **文档编辑器** | ✅ 完成 | ProseMirror |
| **前端页面** | ✅ 完成 | 问答/搜索/编辑 |
| **协同编辑** | 🔜 待实现 | Yjs 集成 |

**总体进度**: 90%（除协同编辑外全部完成）

## ✅ 上线验收清单（RAGFlow 集成）

**基础服务**
- [ ] `ffoa-dev-ragflow` / `ragflow-mysql` / `ragflow-es` / `ragflow-minio` / `ragflow-redis` 正常运行
- [ ] MinIO 已存在 `ragflow` bucket（单桶模式）
- [ ] RAGFlow Chat 默认模型已配置（`qwen-turbo@Tongyi-Qianwen`）

**数据同步**
- [ ] SharePoint 全量同步可触发，任务完成且无致命失败
- [ ] 支持的文件类型可成功解析（pptx/docx/xlsx/md）
- [ ] 不支持类型（如 `.example`）已跳过且记录日志

**功能验证**
- [ ] 知识库搜索可命中 SharePoint 与已发布文章
- [ ] AI 问答返回答案 + 引用来源（Sources）
- [ ] 引用点击可跳转 SharePoint 预览

**配置与安全**
- [ ] `RAGFLOW_API_KEY`、`DASHSCOPE_API_KEY` 已配置且可用
- [ ] 后端 `RAGFLOW_BASE_URL` 指向正确端口（3098）
- [ ] 权限过滤与可见性策略符合文档（发布/草稿/权限）

**回滚策略**
- [ ] 保留旧检索引擎配置与索引数据（如需回滚）
- [ ] 上线前记录 Qdrant 停用与清理步骤

## 📚 模块概述

知识库模块提供企业级文档管理、AI 智能问答、语义搜索、术语管理等功能，支持 SharePoint 集成，帮助企业高效管理和利用知识资产。

**模块职责**：
- ✅ SharePoint 文件索引和元数据管理
- ✅ AI 智能问答（RAG）和语义搜索
- ✅ 知识库权威性和生命周期管理
- ✅ 术语表管理（AI 驱动）
- ✅ 知识统计和度量分析

**不包含**（由其他模块提供）：
- ❌ 富文本编辑能力 → [文档编辑引擎模块](../document-editor/)
- ❌ 文档版本控制 → SharePoint（外部文件）或 [文档编辑引擎](../document-editor/)（KB 原生文章）
- ❌ 审批流程引擎 → [审批引擎模块](../approval/)
- ❌ 通知推送 → [通知引擎模块](../notification/)

## 📖 核心功能

- 📁 **文档管理**：文件上传、版本控制、权限管理、文件夹组织
- 🤖 **AI 智能**：RAG 问答、语义搜索、智能推荐、自动摘要
- 🏷️ **标签系统**：多维度标签、层级结构、AI 自动标注
- 📖 **术语表**：智能术语识别、自动链接、多语言支持
- ⚡ **简化审批**：48小时 SLA、自动升级、智能路由
- 💬 **用户支持**：FAQ 系统、帮助聊天、反馈机制
- 📊 **度量分析**：完整的使用统计和 ROI 分析
- 🔗 **SharePoint 集成**：无缝集成现有 SharePoint 基础设施

## 📑 文档导航

### 核心文档

| 文档 | 说明 | 状态 |
|------|------|------|
| [01-prd.md](./01-prd.md) | 产品需求文档（完整功能设计） | ✅ v1.2.2 |
| [03-architecture.md](./03-architecture.md) | 架构设计与技术实现 | ✅ |
| [06-data-model.md](./06-data-model.md) | 数据模型（占位，待迁移归并） | ⚠️ |
| [05-data-model.md](./05-data-model.md) | 旧数据模型文档（待归并） | ⚠️ |
| [07-api.md](./07-api.md) | API 文档 | 🚧 Draft |
| [05-ui-interaction-spec.md](./05-ui-interaction-spec.md) | UI 交互规范 | 🚧 Draft |
| [09-test-scenarios.md](./09-test-scenarios.md) | 测试场景 | 🚧 Draft |

### 文档说明

#### 📋 01-prd.md
**产品需求文档**（完整功能设计）

包含内容：
- ✅ 产品概述和核心价值（SharePoint 集成策略）
- ✅ 用户角色和权限矩阵
- ✅ 详细功能需求（文档管理、标签系统、搜索、协作、审批、反馈、FAQ）
- ✅ 术语表管理系统（AI 驱动）
- ✅ AI 智能功能（RAG、语义搜索、智能推荐）
- ✅ 模块依赖关系（文档编辑引擎、审批引擎等）
- ✅ 用户体验设计
- ✅ 完整度量体系（时间节省、使用率、质量指标、组织记忆）
- ✅ 实施路线图（MVP + Phase 2/3）
- ✅ 落地关键点与风险

#### 🔗 SharePoint 集成方案
SharePoint 集成策略与落地细节已整理在 `03-architecture.md` 与 `01-prd.md` 中，后续若拆分独立文档将再补充链接。

## 🎯 快速开始

### 1. 了解产品
阅读 [01-prd.md](./01-prd.md) 了解完整的产品设计和功能需求

### 2. 技术方案
阅读 [03-architecture.md](./03-architecture.md) 了解 SharePoint 集成与架构方案

### 3. SharePoint 同步策略
阅读 [05-data-model.md](./05-data-model.md) 了解 SharePoint 集成的技术决策

## 📊 核心指标

| 指标 | 目标 | 业务价值 |
|------|------|----------|
| **时间节省** | 每月 1,000+ 小时 | ¥300K/年成本节省 |
| **PR 周期** | < 24 小时 | 更快交付 |
| **错误率** | 降低 50%+ | 提升质量 |
| **采用率** | 80%+ | 全员参与 |
| **知识保留** | 85%+ | 组织记忆 |
| **ROI** | 124%+ | 6个月回本 |

## 🚀 实施时间表

| 阶段 | 时间 | 内容 |
|------|------|------|
| **准备** | 1周 | Azure AD 配置、环境搭建、SharePoint 自定义字段 |
| **Phase 1: MVP** | 4-6周 | SharePoint 集成、搜索、AI 问答、权限管理 |
| **Phase 2** | 4-6周 | 协作功能、术语表、AI 增强、反馈系统 |
| **Phase 3** | 4-6周 | 知识图谱、企业集成、审批优化 |
| **总计** | **13-19周** | 完整系统上线 |

## 💰 成本优势

使用 SharePoint 集成方案：
- 初始投资：¥200,000（vs 完全自建 ¥500,000+）
- 3年总成本：¥440,000（vs 完全自建 ¥1,100,000+）
- **节省：¥660,000 (60%)**
- **投资回报期：6个月**

## 🔧 技术栈

| 层次 | 技术 |
|------|------|
| **前端** | Next.js 14 + React 19 + Tailwind CSS |
| **后端** | NestJS + TypeScript |
| **文档存储** | SharePoint ⭐️（推荐）/ MinIO |
| **数据库** | PostgreSQL |
| **检索引擎** | RAGFlow (Elasticsearch) |
| **搜索** | SharePoint Search + RAGFlow |
| **AI** | OpenAI GPT-4 + LLM |
| **认证** | Azure AD + MSAL |
| **文档编辑** | 文档编辑引擎模块 ⭐ |

## 🔗 模块依赖

知识库模块依赖以下模块：

| 依赖模块 | 用途 | 文档 |
|---------|------|------|
| **文档编辑引擎** | KB 原生文章编辑、版本控制、协作编辑 | [文档编辑引擎](../document-editor/) ⭐ |
| **审批引擎** | 文档发布审批、权限变更审批 | [审批引擎](../approval/) |
| **组织架构** | 用户、角色、部门管理 | [组织架构](../organization/) |
| **通知引擎** | 审批通知、@提及通知、评论通知 | [通知引擎](../notification/) |
| **反馈系统** | 文档反馈、AI 问答反馈 | [反馈系统](../feedback/) |

> 💡 **设计原则**：知识库聚焦知识管理核心能力（索引、检索、AI 问答、权威性），复用其他模块的通用能力（编辑、审批、反馈、通知）。

## 🎓 相关文档

### 项目文档
- [命名规范](../../NAMING_CONVENTIONS.md)
- [开发标准](../../standards/)

### 其他模块
- [审批引擎](../approval-engine/)
- [表单管理](../form-management/)
- [组织架构](../organization/)

## 📞 联系方式

- 产品负责人：product@example.com
- 技术支持：tech@example.com

## 📝 版本历史

| 版本 | 日期 | 说明 |
|------|------|------|
| v1.4.0 | 2026-02-03 | 检索引擎切换为 RAGFlow，文档同步 |
| v1.3.1 | 2026-01-05 | PRD 模块职责优化，更新所有文档 |
| v1.3.0 | 2026-01-05 | 架构重构：文档编辑能力分离 |
| v1.2.2 | 2025-12-22 | PRD 落地细节深化（可评审版本）|
| v1.1.0 | 2025-12-22 | 完整 PRD + SharePoint 集成方案 |
| v1.0.0 | 2025-12-19 | 初始版本 |

---

**状态**：✅ 已实现 (90%) | **优先级**：P1 | **负责人**：开发团队

> 💡 **提示**：本模块支持 SharePoint 集成，可以充分利用现有基础设施，降低成本和风险。详见 [SharePoint 集成方案](./SHAREPOINT_INTEGRATION.md)。
>
