生成AIとは何か
生成AI(Generative AI)の本質。識別モデルとの違い、確率分布のモデリング、なぜ近年急速に発展したのかを、エンジニア視点で根本から解説。
生成AI(Generative AI) とは、学習したデータの統計的なパターンに基づいて、新しいテキスト・画像・音声・コードなどを 生成 するモデルの総称です。従来の「分類」「予測」を主目的とする識別系AIが「与えられた入力がどのカテゴリに属するか」を答えるのに対し、生成系AIは「次に来る確からしい要素は何か」を繰り返し出力することで、まとまった成果物を組み立てます。
その中核にあるのは 確率分布のモデリング です。たとえば言語モデルは、ある文脈に続く語(厳密にはトークン)の確率分布を学習し、そこからサンプリングして文章を生成します。画像生成モデルは、ノイズから画像へと至る変換の過程を学習します。いずれも「データの背後にある分布を近似し、そこから新しいサンプルを引く」という点で共通しています。
識別モデルと生成モデルの違い
機械学習のモデルは、大きく識別モデル(discriminative)と生成モデル(generative)に分けられます。識別モデルは入力 x が与えられたときのラベル y の条件付き確率 P(y|x) を学習します。一方、生成モデルはデータそのものの分布 P(x) あるいは P(x|y) を学習し、新しい x を作り出せる点に本質的な差があります。
識別モデル
境界線を引く。「これは猫か犬か」。例:ロジスティック回帰、多くの分類器。
生成モデル
分布を学ぶ。「猫らしい画像を描く」。例:LLM、拡散モデル、VAE。
なぜ近年急速に発展したか
生成AIの基礎理論は新しいものではありませんが、実用水準への到達は2010年代後半以降です。背景には三つの要因が重なったと考えられます。
第一に 計算資源(GPU/TPUの大規模化)、第二に データ(Web規模のコーパス)、第三に アーキテクチャの革新、とりわけ2017年に提案された Transformer の登場です。これらが揃ったことで、モデル規模の拡大が性能向上に直結する「スケーリング」が機能するようになりました。
- 確率的生成モデル(probabilistic generative models)
- Vaswani et al. (2017) “Attention Is All You Need” — Transformerの原論文
- スケーリング則(neural scaling laws)に関する一連の研究