https://arxiv.org/pdf/2411.11984
arXiv:2411.11984 | ByteDance Seed & UC Santa Cruz
核心问题
现有CoT评估方法的两大缺陷:
- 依赖人工标注数据
- 无法准确评估中间推理步骤,高误报率
理论框架
1. 信息增益量化
将CoT推理形式化为信息论问题,定义每个推理步骤 si 的信息增益:
I(si;Y∣s<i,X)=H(Y∣s<i,X)−H(Y∣s≤i,X)
其中:
- X: 输入问题
- Y: 目标答案
- si: 第 i 个推理步骤
- s<i: 前 i−1 个步骤
- H(⋅): 条件熵
物理意义:量化步骤 si 对减少答案不确定性的贡献
2. 失败模式识别
通过信息增益阈值判定:
- 若 I(si;Y∣s<i,X)<ϵ,则步骤 si 为失效步骤
- 无需ground truth标注,仅需模型自身概率分布
3. 理论优势
相比outcome-based方法,该框架能够:
- 细粒度诊断:定位具体失败的子任务
- 无监督评估:利用 P(Y∣s≤i,X) 自动计算
- 可解释性:信息论度量提供直观物理解释
实验验证
数据集:Arithmetic, GSM8K, PRM800k
关键结果:
- 准确识别无效推理步骤(低信息增益)
- 显著优于传统outcome-based方法
- 与人工标注结果高度一致
方法论意义
提供了首个无需标注的CoT推理步骤评估框架,通过信息论工具实现:
- 推理过程的定量分析
- 模型能力的细粒度刻画
- 训练数据质量的自动筛选
Key Insight: 将推理评估从结果层面推进到过程层面,用信息增益量化每步贡献