能動的推論(Active Inference)の詳細解説

能動的推論(Active Inference)の詳細解説

能動的推論(Active Inference, AIF)は、カール・フリストン(Karl Friston)が提唱した自由エネルギー原理(Free Energy Principle, FEP)の核心的な展開形です。FEPが「すべての自己組織化システム(生命・脳など)は変分自由エネルギーを最小化する」という普遍的な原理であるのに対し、能動的推論は「行動を通じて世界を変え、予測を満たす」具体的なプロセス理論です。

簡単に言うと:

  • 受動的推論(Perceptual Inference):感覚入力を受け取って内部モデルを更新(予測誤差を修正)。
  • 能動的推論:行動を選択・実行して感覚入力を「予測通りにする」(世界を自分の予測に合わせる)。

これにより、知覚・学習・行動・計画・意思決定がすべて「自由エネルギー最小化」という単一の原理で統一されます。脳やAIエージェントが「驚き(surprise)を避け、自己を維持する」ための自然なメカニズムです。

1. なぜ「能動的」か? FEPとの関係

FEPでは、システムは変分自由エネルギー(Variational Free Energy, VFE)を最小化します。これは「予測誤差の上限」として計算可能で、ベイズ推論の近似です。

  • 知覚(Perceptual Inference):内部の生成モデルを更新してVFEを減らす(モデルを現実により近づける)。
  • 行動(Active Inference):行動により外界を変えて感覚入力を予測通りにし、VFEを減らす。

能動的推論は後者を扱い、「世界を自分の信念に合わせる」という積極的な戦略を取ります。これが生物の適応行動(例:喉が渇いたら水を飲む)の本質です。

2. 数学的基礎:期待自由エネルギー(Expected Free Energy, EFE / G)

行動選択の鍵は期待自由エネルギー(Expected Free Energy)です。将来的な自由エネルギーを予測し、それを最小化する行動を選びます。

主な展開形(簡略化):

[
G(\pi) = \underbrace{\mathbb{E}{Q(o,s|\pi)} \left[ \ln Q(s|\pi) – \ln P(s,o) \right]}{\text{Risk (リスク)}} + \underbrace{\mathbb{E}{Q(s|\pi)} \left[ H[P(o|s)] \right]}{\text{Ambiguity (曖昧さ)}}
]

  • Risk(実利的価値 / Pragmatic Value):現在の信念(好ましい状態)と予測される未来のズレ(目標達成の失敗リスク)。
  • Ambiguity(認識的価値 / Epistemic Value):未来の観測の不確実性(探索・情報獲得の価値)。

行動政策 (\pi) を選び、G(π) を最小化するものが選択されます。これにより:

  • 実利的価値 → 目標達成(exploitation)。
  • 認識的価値 → 好奇心・探索(exploration)。

この2つのバランスが自然に生まれるのが能動的推論の美点です。

(注:詳細な導出は変分ベイズ推論に基づき、Markov Blanketでシステムと環境を分離して扱います。)

3. プロセス全体の流れ

  1. 生成モデル(Generative Model)の構築:脳/AIは「世界の因果モデル」(隠れ状態 s → 観測 o)を内部に持つ。
  2. 予測生成:上位層から下位層へ予測を降ろす(トップダウン)。
  3. 予測誤差検知:感覚入力とのズレを計算。
  4. 知覚更新:誤差を最小化するよう信念を修正(受動的)。
  5. 行動選択:期待自由エネルギーが最小になる行動を実行(能動的)。
  6. 世界を変える:行動により感覚入力が予測に近づき、自由エネルギーが低下。

これが予測符号化(Predictive Coding)と統合され、階層的・時間的に展開します(深層能動的推論)。

4. 具体例

  • 生物学的例:飢餓 → 「食べ物があるはず」という予測 → 探しに行く行動(世界を予測通りに変える)。探索(新しい場所)と搾取(知ってる場所)のバランスがEFEで自然に決まる。
  • AI・ロボティクス:ロボットが未知環境を探索しながら目標達成。深層能動的推論で世界モデルを学習し、質問生成や空間知識獲得を実現(例:実ロボット実験)。
  • 精神医学:統合失調症は予測誤差処理の異常 → 能動的推論が破綻し、妄想が生じる。自閉症は予測が弱く、曖昧さが過大評価される。

5. ヨブ記の文脈での示唆(前回の議論つなぎ)

ヨブの理不尽な苦難は巨大な予測誤差。友人たちは低次モデル維持(受動的推論のみ)で誤差を無視しようとしたが、ヨブは能動的推論的に神に抗議・対話(行動)し、世界モデルを宇宙スケールへ更新。神の「答え」(自然描写)はヨブの期待自由エネルギーを最小化する「高次行動」として機能します。まさに「苦難の中で積極的に意味を創出する」プロセスです。

6. 応用と限界

  • 強み:内発的動機(好奇心)・探索-搾取バランス・具身体化AIに最適。ロボティクス、計算精神医学、HCIで実用化が進む。
  • 限界:数学的に複雑で大規模実装が難しい。完全な生物再現にはまだ至らず、発展途上。

能動的推論は「脳がどうやって世界と相互作用するか」を根本から説明する強力な枠組みです。FEP全体の「行動版」と言えます。数学的詳細(EFEの導出)や具体的なAI実装例、最新論文の深掘りが必要でしたらお知らせください!

タイトルとURLをコピーしました