[EMNLP2025 Main] Too Consistent to Detect: A Study of Self-Consistent Errors in LLMs

Motivation: 自洽错误的频率随着模型规模的增加而持续甚至增加

Method: 既有方法拿 hidden state 训练一个分类器, 这个分类器给出一个分数. 这篇论文增加了一个跨家族的分类器, 两个分类器加权得到最终的分数