付A 付録 / 用語と情報源

用語集

トークン、埋め込み、Transformer、アテンション、LLM、コンテキストウィンドウ、ハルシネーション、RAG、Fine-tuning ほか主要用語の要約。

読了 約4分 最終更新 2026.05 用語集リファレンス

本サイトに登場する主要な用語を要約します。詳細は各章を参照ください。各用語にはアンカーが振られており、本文中の Term 経由でここへリンクされます。

トークン
モデルが処理する最小単位。テキストを分割した断片。コストと上限に直結する。詳細は第3章 3.1
埋め込み(Embedding)
トークンや文を、意味を反映した高次元ベクトルに変換したもの。詳細は第3章 3.2
Transformer
自己注意機構を中核とする、現代の生成AIの基盤アーキテクチャ。詳細は第3章 3.3
アテンション
各トークンが他のどのトークンに注目するかを動的に計算する機構。
LLM
大規模言語モデル(Large Language Model)。大量テキストで学習したテキスト生成モデル。
コンテキストウィンドウ
一度に処理できるトークン数の上限(入力+出力)。詳細は第3章 3.6
temperature
出力のランダム性を制御する推論パラメータ。低いほど決定的、高いほど多様。
RLHF
Reinforcement Learning from Human Feedback。人間のフィードバックを用いてモデルを人間の好みに整合させる学習段階。
ハルシネーション
事実と異なる内容を、もっともらしく生成してしまう現象。詳細は第9章 9.2
RAG
検索拡張生成(Retrieval-Augmented Generation)。外部文書を検索し文脈に加えてから生成する手法。詳細は第5章 5.5
Fine-tuning(微調整)
追加データでモデルの重みを更新し、特定用途へ適応させること。詳細は第6章 6.2
LoRA / PEFT
少数のパラメータのみを効率的に学習する微調整手法。
拡散モデル
ノイズから段階的に復元して生成する方式。画像生成の主流。詳細は第4章 4.2
マルチモーダル
テキスト・画像・音声など複数種類の情報を扱えるモデル。
エージェント
ツールを使い、自律的に計画・実行して目標を達成する構成。詳細は第6章 6.3