How a Decoder LLM Works

An interactive companion to the talk. We trace one sentence — "the dog ran" — up the decoder, block by block.

Click a block to open it (or page through with / ).

講演のためのインタラクティブな副教材です。1つの文——「the dog ran」——がデコーダーをブロックごとに上っていく様子を追います。

ブロックをクリックすると開きます(または / でページ送り)。

Read bottom → top: tokens become vectors (Embedding), each token mixes in context from earlier tokens (Attention), then is processed on its own (FFN) — repeated over N layers — to predict the next token.

下から上へ読みます:トークンがベクトルになり(Embedding)、各トークンが前のトークンから文脈を取り込み(Attention)、その後それぞれ単独で処理されます(FFN)——これを N 層くり返して、次のトークンを予測します。

Built one weight-block at a time, the same way the talk grows the diagram.

講演で図を育てていくのと同じように、重みブロックを1つずつ組み上げていきます。