没有问题,但随着对话推进,模型对「什么是帮助用户」的理解悄悄偏移了,而它自己完全没有感知到这种变化正在发生。 整体来看,一个在训练阶段「对齐好了」的模型,在真实使用过程中会持续被重塑。它可能会被「对齐」成更适合某个产品形象的版本,也可能在某个足够复杂的上下文里突然跳出预期的边界,给出让开发者和用户都始
当前文章:http://j11ti4.zentaike.cn/poy/m6d.html
发布时间:14:23:42