大模型幻觉研究 probing based

Posts

Publications

About

Motivation: 自洽错误的频率随着模型规模的增加而持续甚至增加

Method: 既有方法拿 hidden state 训练一个分类器, 这个分类器给出一个分数. 这篇论文增加了一个跨家族的分类器, 两个分类器加权得到最终的分数

0 %