可视化资源

自回归:一个字一个字生成

GPT 写文章,不是一次性吐出一整段,而是一个字一个字往外蹦:看着目前已经写出的内容,预测下一个最可能的字,写下它;然后把这个新字接回输入,再预测下一个……如此循环,直到写完。这种“拿自己刚写的当输入、继续往下写”的方式叫自回归。点“下一词”,看它怎样一步步把句子接出来,注意每写一个字,输入就长一点、再喂回去。

上面一行是已生成的内容(绿色箭头表示“接回输入”)。下面是模型对下一个词的概率预测,最高的那个(蓝色)被选中、添加到句尾。

已生成 0 词
预测下一词

每步只做一件事:根据已有内容,给词表里每个词打一个概率。

接回输入

选出的词被拼到序列末尾,作为下一步的输入——“自”己的输出“回”到输入。

逐词成文

循环几十上百次,就从一个开头“长”出整段文字。慢,但每步都可控。