自回归：一个字一个字生成

GPT 写文章，不是一次性吐出一整段，而是一个字一个字往外蹦：看着目前已经写出的内容，预测下一个最可能的字，写下它；然后把这个新字接回输入，再预测下一个……如此循环，直到写完。这种“拿自己刚写的当输入、继续往下写”的方式叫自回归。点“下一词”，看它怎样一步步把句子接出来，注意每写一个字，输入就长一点、再喂回去。

上面一行是已生成的内容（绿色箭头表示“接回输入”）。下面是模型对下一个词的概率预测，最高的那个（蓝色）被选中、添加到句尾。

已生成 0 词

预测下一词

每步只做一件事：根据已有内容，给词表里每个词打一个概率。

接回输入

选出的词被拼到序列末尾，作为下一步的输入——“自”己的输出“回”到输入。

逐词成文

循环几十上百次，就从一个开头“长”出整段文字。慢，但每步都可控。