# AI Review 自动准确率评估 · 2026-05-11（近 30 天）

**生成时间**: 2026-05-11 13:54 +0800
**数据源**: Gitea API · FFAIWorkspace/workspace + 本地 .learnings/ERRORS/
**采样**: 109 个跑过 AI Review 的 PR / 58 个 hotfix PR / 82 个 ERR 笔记

> **综合分**: **72.5%** ✅ 达标（门槛 70%）

> 本脚本替代人工抽样标注（#259 D4 解锁条件）。基于客观 proxy 指标做团队趋势判断，
> 不试图给单条 review 打分。详细方法见脚本头注释。

---

## 各项指标

| 指标 | 值 | 权重 | 加权贡献 | 语义 |
|---|---|---|---|---|
| 采纳率 | 99.5% (401/403) | 30% | 29.9 | finding 跨轮消失 = 被修了 |
| 自洽率 | 100.0% (215/215) | 30% | 30.0 | verdict 与 findings.severity 一致 |
| Block 合理性 | 50.0% (1/2) | 25% | 12.5 | block 下轮降级 = 真问题 |
| 漏检率（反向计分）| 漏检 98.8% (80/81) | 15% | 0.2 | verdict=pass 后 14d 出 hotfix |

## 自洽性问题样本

_无_

## 数据局限

- **采纳率**：finding 在下轮没出现可能是被修、也可能是 AI 这次没指出（盘点已知问题）。stable_id 落地后追踪更稳
- **漏检率**：粗 proxy，hotfix 跟 verdict=pass PR 模块无关也算了，会高估漏检
- **block 合理性**：DRY RUN 期 block 不阻断，靠下轮降级判断；如果 PR 后续没再触发 review，整个 PR 不计入
- **自洽率**：老评论（schema 化前）verdict 解析为空 → 跳过不计入分母

## 决策（#259 D4 / #171 转正）

✅ **综合分 72.5% ≥ 70%，可启动 D4 退出 DRY RUN**

操作：
1. `.gitea/workflows/ai-review.yml` 删 `AI_REVIEW_DRY_RUN: '1'` 那行
2. Gitea web → repo Settings → Branches → develop 保护规则 → 必需检查加 `ai-review`
3. 同步 `docs/ops/02-gitea-config.md` + `docs/standards/05-development-workflow.md`
4. 关闭 #259 + #171

---
_Generated by `scripts/ops/ai-review-auto-eval.py`. 跟踪 [#259](http://43.130.59.228/FFAIWorkspace/workspace/issues/259) / [#171](http://43.130.59.228/FFAIWorkspace/workspace/issues/171)._