自回归:一个字一个字生成
GPT 写文章,不是一次性吐出一整段,而是一个字一个字往外蹦:看着目前已经写出的内容,预测下一个最可能的字,写下它;然后把这个新字接回输入,再预测下一个……如此循环,直到写完。这种“拿自己刚写的当输入、继续往下写”的方式叫自回归。点“下一词”,看它怎样一步步把句子接出来,注意每写一个字,输入就长一点、再喂回去。
上面一行是已生成的内容(绿色箭头表示“接回输入”)。下面是模型对下一个词的概率预测,最高的那个(蓝色)被选中、添加到句尾。
预测下一词
每步只做一件事:根据已有内容,给词表里每个词打一个概率。
接回输入
选出的词被拼到序列末尾,作为下一步的输入——“自”己的输出“回”到输入。
逐词成文
循环几十上百次,就从一个开头“长”出整段文字。慢,但每步都可控。