Anthropic新研究!模型失控率降至7%,对齐数据训练量仅需1/60

Anthropic新研究!模型失控率降至7%,对齐数据训练量仅需1/60