ガーシュマンの計算論的認知科学:体系的詳説
I. 出発点:なぜ「計算論」なのか
説明の三水準(マーの枠組み)
ガーシュマンの計算論的認知科学を理解するには、David Marrが1982年に提唱した説明の三水準から始めることが不可欠です。これは認知科学の方法論的基盤であり、ガーシュマンの全議論がこの枠組みの上に立っています。
| 水準 | 問い | 内容 | 例(視覚) |
|---|---|---|---|
| 計算論水準 | 何を計算しているか | 目標・機能・入出力の仕様 | 「3次元構造を奥行き手がかりから復元する」 |
| アルゴリズム水準 | どのように計算するか | 手続き・表現・過程 | 「両眼視差の比較アルゴリズム」 |
| 実装水準 | 何が計算を実現するか | 神経・物理的基盤 | 「V1野の方位選択性ニューロン」 |
Marrの根本的主張:上位水準の理解なしに下位水準は理解できない。ニューロンの発火パターンを記述しても、それが「何のため」の計算かが分からなければ理解にならない。
ガーシュマンは主に計算論水準を問います。「脳は何を計算しているか」「その計算の論理的構造は何か」という問いです。これが彼のアプローチを純粋な神経科学とも純粋な心理学とも異なるものにしています。
なぜベイズ推論が中心に置かれるか
ガーシュマンの枠組みの核心にベイズ推論があることは偶然ではありません。これには認識論的理由があります。
推論の根本問題:
いかなる知的システムも、不完全なデータから世界の状態を推定しなければなりません。망막に投射された2次元像から3次元世界を復元する視覚系も、限られた経験から言語規則を獲得する幼児の脳も、数発の銃声から危険を判断するサバンナの猿も、すべて同一の構造的問題に直面しています:
問題:データ D が観測された。
原因 H(仮説・状態)は何か?
正式化:P(H|D) = P(D|H) × P(H) / P(D)
ベイズの定理はこの問いへの唯一の数学的に一貫した解答です(Cox定理による公理的導出)。主観的確率の公理を満たす合理的信念更新は、必然的にベイズ形式をとらなければならない。
これは経験的主張ではなく、論理的必然性です。ゆえにガーシュマンにとって「脳はベイズ推論をしているか」という問いは問い方が間違っており、正しくは「脳はいかなる形でベイズ推論を近似しているか」です。
II. 帰納バイアスの数学的構造
A. 帰納問題の正確な定式化
「帰納問題(problem of induction)」はヒュームが提起した哲学的問題ですが、ガーシュマンはこれを数学的に精確に定式化します。
仮説空間の爆発:
有限のデータ $D = {x_1, x_2, …, x_n}$ が与えられたとき、これと論理的に整合する仮説の集合 $\mathcal{H}$ は一般に無限です。
例:10個の点からなる散布図を「説明する」関数は無限に存在する。 例:「太陽は今まで毎日昇った」という観察と整合する法則は「明日も昇る」以外に無限にある。
No Free Lunch定理(Wolpert, 1996):
すべての仮説に等しく事前確率を割り当てる(完全無情報)推論システムは、いかなる汎化問題においても、ランダムな推測と平均的に同等の性能しか持てない。
定理の意味:
「バイアスなしの学習」は存在しない。
汎化するためには必ず何らかの帰納バイアスが必要。
問題は「バイアスを持つか否か」ではなく「いかなるバイアスを持つか」。
これがガーシュマンの出発点です。帰納バイアスは知性の欠陥ではなく、知性の論理的必要条件である。
B. 帰納バイアスの数学的形式
ベイズ的枠組みでは帰納バイアスは事前確率分布 P(H) として形式化されます。
事前確率は以下を決定します:
- 仮説空間の構造:どのような仮説が「考慮される」か
- 仮説の相対的確率:どの仮説が「より可能性が高い」か
- 汎化の方向性:新しいデータをどの方向に解釈するか
単純性バイアスの数学的形式:
オッカムの剃刀は情性の表現ですが、ベイズ的には複雑なモデルに対するペナルティとして形式化されます:
P(H) ∝ exp(-λ × complexity(H))
λ > 0 のとき、複雑なモデルほど事前確率が低い
これは機械学習の**正則化(regularization)**と数学的に同型です。L1正則化(LASSO)、L2正則化(Ridge回帰)は、それぞれ異なる形の単純性事前確率に対応します。
重要な洞察:機械学習が経験的に有効な正則化として発見したものと、人間の認知が自然選択によって採用したバイアスが、同じ数学的構造を持つことは偶然ではない。どちらも同一の帰納問題への解答だからです。
C. 階層的帰納バイアス
単純な一水準のモデルではなく、ガーシュマンは階層的事前確率を強調します。
超事前確率(hyperprior):
事前確率のパラメータそのものについての事前確率を持つ構造:
P(θ|α):パラメータθについての事前確率(αをハイパーパラメータとして)
P(α):ハイパーパラメータαについての超事前確率
これは以下を可能にします:
- 迅速な学習(fast learning):少数のデータから特定の概念を学ぶ
- 学習の転移(transfer learning):ある領域で学んだ構造を別領域に適用する
- 類推(analogy):表面的に異なる状況の深層的構造の共有を認識する
具体例:幼児の言語獲得
幼児は少数の事例から動詞の活用規則を学習します(One-shot learning)。これが可能なのは、「言語は規則的構造を持つ」「新しい語は既知の規則に従う」という**階層的帰納バイアス(=言語の普遍的制約についての超事前確率)**があるからです。
III. 近似バイアスの理論的構造
A. 計算複雑性の壁
完全なベイズ推論が不可能な理由を正確に述べます。
確率推論の計算複雑性:
一般的なベイズ推論は**#P困難(#P-hard)**です。これはNP完全問題よりも困難であることを意味し、変数の数に対して指数関数的な計算量を要します。
N個の二値変数がある場合:
完全列挙:2^N の計算
N = 100 → 約10^30 の計算
(宇宙の原子の数が約10^80)
したがって:
命題:生物学的神経系が完全なベイズ推論を実行することは、物理的に不可能である。
帰結:すべての現実的推論システムは近似を行う。近似は設計上の欠陥ではなく計算論的必然である。
B. 近似アルゴリズムの分類
ガーシュマンは人間の認知を特定の近似アルゴリズムの実装として理解します。主要な近似戦略:
1. 変分推論(Variational Inference)
真の事後確率 $P(H|D)$ を、扱いやすい分布族 $Q(H)$ で近似する:
最小化:KL散逸 KL[Q(H) || P(H|D)]
= ∫ Q(H) log[Q(H)/P(H|D)] dH
認知的対応:
- 連続量を離散カテゴリに圧縮する知覚的カテゴリ化
- 複雑な感情状態を単純な感情ラベルに還元する
- 複雑な確率分布を平均・分散の2パラメータで代表させる
近似誤差(バイアス)の性質:KL散逸の最小化は、真の分布の分散を過小評価する傾向を持ちます。これは人間の確率判断が理論上の分散より小さく見積もる傾向(過信バイアス)として現れます。
2. サンプリング近似(Monte Carlo方法)
積分計算をランダムサンプルの平均で近似する:
E[f(H)] = ∫ f(H) P(H|D) dH
≈ (1/N) Σ f(h_i), h_i ~ P(H|D)
認知的対応:
Vul, Goodman, Griffiths, Tenenbaum(2014)の「サンプリングとしての人間判断(One and Done)」仮説:人間の確率判断は多数のサンプルからではなく、少数(場合によっては1つ)のサンプルから構成されます。
この仮説から予測されること:
- 同一問題への反復応答に大きなバラツキがある
- 集団の判断の平均は個人より優れる(知恵の集合)
- 少数サンプルからの系統的誤差が確率判断バイアスとして現れる
ギャンブラーの誤謬の再解釈:
「コインが5回連続表が出た後、次は裏が出やすい」という誤謬は、サンプリング的には「5回連続表のような偏ったシーケンスは、公正なコインからは稀にしかサンプリングされない」という観察から生じる合理的推論です。ただしこれはコイン自体についての誤謬ではなく、コインの性質についての確率判断への不正な適用です。
3. ヒューリスティクス(Heuristics)
特定の問題構造に対して効率的な近似を行う問題固有のアルゴリズム:
| ヒューリスティクス | 近似している計算 | バイアスの方向 |
|---|---|---|
| 代表性 | 条件付き確率 P(H|D) | 基準率の無視 |
| 利用可能性 | 頻度・確率の推定 | 想起しやすさへの過大評価 |
| アンカリング | 数値推定 | 初期値への過剰重み付け |
| 認識 | 未知項目の評価 | 認識された項目の過大評価 |
ガーシュマンの革新:これらのヒューリスティクスは特定の生成モデル・特定の事前確率を持つベイズ推論の近似解として導出可能です。「バグ」ではなく特定の計算問題への「特化アルゴリズム」です。
C. 精度と速度のトレードオフ
近似バイアスの核心は**速度-精度トレードオフ(speed-accuracy tradeoff)**です。
完全な計算
高精度・低速・高コスト
↕
近似計算
低精度・高速・低コスト
ガーシュマンの重要な主張:このトレードオフの最適解は問題の構造によって異なります。
高速近似が最適な場合:
- 時間的緊迫性が高い(捕食者からの逃走)
- データが乏しく精密な計算が無意味
- 環境の統計的安定性が高い(慣習的行動が有効)
精密な計算が最適な場合:
- 高い賭けで時間的余裕がある
- 複数の選択肢の細かな差異が結果を大きく左右する
- 環境が急変しており既存モデルが不正確
精神病理との接続:強迫症は「精密な計算が最適でない状況で精密さを追求し続ける」計算論的誤謬として記述できます。
IV. ベイズ脳仮説の全体像
A. 三つの命題の区別
「脳はベイズ的」という主張は実は複数の異なる命題を含んでおり、区別が重要です:
命題1(規範的):合理的推論はベイズ形式をとるべきである。 → これは数学的事実であり、ガーシュマンはこれを前提とします。
命題2(記述的・弱形式):人間の行動はベイズ的推論と質的に類似した特徴を持つ。 → これは概ね支持されており、ガーシュマンの主要主張。
命題3(記述的・強形式):人間の脳は文字通りベイズ計算を実行している。 → これは未解決であり、ガーシュマンはより慎重です。
ガーシュマンの立場の精確な記述:「脳が完全なベイズ推論をしているとは言わない。しかしベイズ的枠組みが、脳の計算の規範的構造と逸脱の組織的パターンの両方を最もよく記述する。」
B. ベイズ脳仮説への批判と応答
この批判は正確に理解する価値があります。
批判1:過剰適合(Overfitting Objection)
「どのようなデータもベイズモデルで説明できる。十分に強い事前確率を仮定すれば何でも説明できてしまう。」
ガーシュマンの応答:
- 事前確率は独立した証拠(進化的論理、発達的制約、他の行動データ)によって制約可能
- モデル比較にはBayes Factor(ベイズ因子)を使い、過剰適合を制御できる
- 予測の失敗が理論を棄却する。バイアスの方向だけでなく定量的予測が可能
批判2:代替説明の存在
「同じ現象がヒューリスティクスや進化的モジュール理論でも説明できる。ベイズ的説明に特別な優位性はない。」
ガーシュマンの応答:
- ベイズ的枠組みは統一的であり、個々の現象に個別の説明を発明する必要がない
- 異なる認知領域(視覚、言語、推論、意思決定)を同一の計算原理で記述できる
- ヒューリスティクス理論はなぜそのヒューリスティクスが存在するかを説明しないが、ベイズ的枠組みはそれを説明できる
批判3:神経科学的実装の不明確さ
「ベイズ計算を脳が実装するメカニズムが不明確。」
ガーシュマンの応答:
- これはアルゴリズム水準・実装水準の問いであり、計算論水準の正しさとは独立
- ただし自身もサンプリング仮説、変分推論仮説などの実装モデルの研究を行っている
V. 主要テーマ別の深化
A. 社会的学習と文化の計算論
第4章(人の振りみてわが振り学ぶ)の議論を深化させます。
社会的学習の計算論的定式化:
他者の行動を観察することは、その行動を生んだ生成モデル(知識・信念・目標)についての推論です:
観察:他者がある行動 a をとった
推論:その行動を生んだ目標 g と信念 b は何か?
P(g, b | a) ∝ P(a | g, b) × P(g) × P(b)
過模倣(overimitation)の深い解釈:
チンパンジーと異なり、人間の幼児は因果的に不要な行動もコピーします。なぜか:
人間の幼児は「行動者は目的論的行為者であり、すべての行動には意図がある」という強い帰納バイアスを持っています。従って、
「この行為者が表面上は無意味な行動をしているということは、私には分からない意図があるに違いない。だから全部コピーする。」
これは文化的知識の累積的伝達(ratchet effect)を可能にします。文化の複雑な慣習・儀式・制度が「意味不明でもコピーする」バイアスによって世代を超えて伝達されます。
文化的進化の計算論:
ガーシュマンは個人の学習と文化的進化を同一の計算論的枠組みで記述します:
個人学習:経験データによる個人内の事前確率の更新
文化進化:社会的伝達による集団内の事前確率の更新
生物進化:自然選択による遺伝的事前確率の更新
三者は異なるタイムスケールと伝達メカニズムを持つが、構造的に同型です。
B. 言語の計算論:第11章の深化
言語の設計原理をどう理解するか
ガーシュマンは言語の構造を効率的な情報伝達のためのコードとして分析します。
ジップの法則と最適符号化:
自然言語において、単語の頻度 $f$ とその長さ $L$ の間には:
f × L ≈ 定数(近似的)
高頻度語は短く(the, is, a)、低頻度語は長い。これはシャノン情報理論の最適符号化定理(ハフマン符号)の予測と一致します:頻度に応じたコード長の割り当てが情報伝達効率を最大化します。
言語の曖昧性の合理性:
自然言語の顕著な特徴として曖昧性があります(「私は眼鏡の男を見た」)。直感的に「非効率」に見えますが:
送信者・受信者が共有する文脈(common ground)を利用することで、曖昧な短い表現が長い明確な表現より情報効率が高くなります。文脈が絞ることで、短いコードが正確に伝達されます。
形式言語との対比(ロジバン):
曖昧性を排除した人工言語ロジバンは論理的に完全ですが、実際のコミュニケーションでは非効率です。なぜなら:
- 文脈共有の利用ができない
- すべての情報を明示するため表現が長大になる
- 人間の生成モデルの制約(帰納バイアス)と整合しない
ガーシュマンの主張:自然言語の「欠陥」は使用者の認知構造との**最適な整合性(alignment)**の表れです。
C. 確率的思考と宗教:第9章の深化
これはKonさんの関心(進化論と宗教)と深く交差します。
超自然的信念の計算論的起源
ガーシュマンの分析の精緻な再構成:
ステップ1:エージェンシー検出システム
知的行為者(エージェント)の検出は進化的に重要な計算です。被食者の行動、競合他者の意図、協力者の信頼性—これらはエージェントのモデル化(Theory of Mind)を必要とします。
このシステムの帰納バイアス:「不明な動きはエージェントによるものである可能性を高く評価する」
これはHADD(過活性化エージェント検出装置)—Barrettの概念—として記述されます。
ステップ2:予測誤差とエージェント仮説
説明のつかない出来事(病気、嵐、予想外の死)は強い予測誤差を生みます。この予測誤差を最小化するために脳は説明を求めます。「隠れたエージェント(神、精霊、悪魔)」は強力な説明仮説となります:
予測誤差最小化:
「なぜ子供が病気になったのか」
↓ 仮説生成
「怒った精霊が病気を送った」(隠れたエージェント仮説)
↓ 予測誤差消去
「儀式で精霊を鎮めれば病気が治る」(能動的推論)
ステップ3:信念の社会的強化
第6章(補助仮説)と接続:宗教的信念は反証を補助仮説で吸収する構造を持ちます。「儀式をしたのに病気が治らなかった」→「儀式が不完全だった」「信仰が足りなかった」。
この反証不能構造は欠陥ではなく、信念体系の安定性の計算論的基盤です。
ガーシュマンの立場の精確な記述:
宗教的信念を「非合理」と断定するのは表層的です。それは:
- 帰納バイアス(エージェンシー検出)の適用
- 予測誤差最小化の試み
- 強力な帰納バイアスを持つ信念体系(高精密度の事前確率)の形成
というベイズ的推論の産物です。問題はその**信念が更新可能かどうか(精密度の適切な設定)**にあり、信念の内容の非科学性は二次的問題です。
D. ランダム性の認知論:第12章の深化
確率的行動の適応的価値
決定論的行動(常に最善と思われる行動を選択する)の限界:
局所最適解への陥穽:
強化学習の枠組みで:
搾取(exploitation):現在の知識に基づく最善行動
探索(exploration):新しい行動による情報獲得
最適戦略:適切な探索-搾取のバランス
完全な決定論的搾取は局所最適解からの脱出不能を生みます。確率的・ランダムな要素が局所最適解からの脱出を可能にします(物理学における「焼きなまし法(simulated annealing)」と同型)。
Thompson Sampling:
確率的探索の最適アルゴリズムの一つ。事後確率分布からサンプリングして行動を選択します。これは:
- 高確率で最善と思われる行動を選択(搾取)
- 一定確率でそれ以外を選択(探索)
- 確率は不確実性に応じて自動調整
人間の探索行動がThompson Samplingの特性を示すことが実験的に支持されています。
子供の好奇心の計算論:
Celeste Kidd、Aimee Stahl、Richard Asnowらの研究:幼児は「予測可能すぎるもの」にも「全く予測不能なもの」にも飽きます。中程度の不確実性に最も注意を向けます。
計算論的解釈:情報獲得の期待値(Expected Information Gain)を最大化する探索戦略。最も学習効率が高い情報源に選択的に注意を向けます。
VI. ガーシュマン理論の位置づけ:知的系譜と現在地
A. 計算論的認知科学の系譜
【哲学的基盤】
ヒューム(帰納問題)→ カント(ア・プリオリな認識形式)
→ 論理実証主義 → ポパー(反証主義)
【情報理論・サイバネティクス】
Shannon(情報理論, 1948)→ Wiener(サイバネティクス)
→ 初期認知科学(Newell, Simon)
【ベイズ統計学】
Laplace → Jeffreys → Savage → de Finetti
→ 主観的確率論の基盤
【計算論的認知科学の確立】
Marr(三水準枠組み, 1982)
Anderson(合理的分析, 1990)
Tenenbaum, Griffiths(現代ベイズ認知科学, 2000年代)
【ガーシュマン】
↑ 上記すべてを継承しつつ
「近似バイアス」という新次元を前景化
帰納バイアスと近似バイアスの統一的枠組み
B. 同時代の関連研究者との関係
Josh Tenenbaum(MIT): ガーシュマンの同僚・先輩格。「プログラム帰納(program induction)」として人間の概念学習をモデル化。ガーシュマンより「完全なベイズ推論」に近いモデルを使う傾向があります。
Tom Griffiths(Princeton → Berkeley): 人間の認知を規範的ベイズ理論と比較する実験的研究。本書の推薦者でもあります。
Wei Ji Ma(NYU): 感覚運動制御における確率的推論の神経実装。同じく本書の推薦者。
Karl Friston(UCL): 自由エネルギー原理・能動的推論。ガーシュマンと理論的方向性を共有しますが、神経科学的実装への焦点が強い。
Gerd Gigerenzer(MPI Berlin): 「エコロジカル合理性」。ガーシュマンと結論は類似(バイアスは合理的)しますが、ベイズ的枠組みを拒否し、「fast and frugal heuristics」を主張します。この対立は現在も継続中です。
VII. 未解決問題と今後の方向性
ガーシュマン自身が認識する未解決問題群:
1. 事前確率の起源問題
帰納バイアス(事前確率)は「進化」と「学習」から来ると言われますが、この二つの相対的寄与の定量的評価は困難です。
また:事前確率の更新(学習)のための事前確率は何か?—無限遡及の問題。
2. 近似アルゴリズムの神経的実装
人間の認知がサンプリングなのか変分推論なのか、それとも別の近似か—実装水準での決定的証拠がありません。
3. 個人差のモデル化
計算論的モデルは平均的な「合理的エージェント」を記述しますが、個人差(神経症傾向、認知様式、文化差)をどう組み込むかは未解決です。
4. 社会的推論の複雑性
他者の心の読み取り(Theory of Mind)を完全にベイズ的に定式化すると、**再帰的推論(「あなたは私がこう思っていると思っている」の無限後退)**が生じます。これを計算論的に扱う研究が進行中です。
5. 意識と計算論の関係
計算論的枠組みは意識体験(qualia)の問いに何を言えるか—これはガーシュマンの現在の研究の最前線です。
VIII. 体系的評価
ガーシュマンの計算論的認知科学の本質的貢献を、批判的距離を保ちながら評価します。
貢献
統一性:知覚・言語・推論・意思決定・社会的学習・宗教的信念—これらすべてを同一の計算論的原理(帰納バイアス + 近似バイアス)で記述できる。これは認知科学に先例のない統一性です。
橋渡し機能:機械学習理論と認知心理学、進化論と神経科学、哲学的認識論と実験科学—これらを計算論的言語で接続します。
バイアスの概念転換:「欠陥除去」から「構造理解」へのパラダイム転換に数学的基盤を与えます。
限界
現象の豊かさの喪失:人間の認知体験の質的豊かさ—好奇心、驚き、美的体験、道徳的直感—が数学的定式化によって薄められる危険があります。
説明の事後的性格:観察された現象に合わせた事前確率を事後的に設定することで、何でも説明できてしまう循環の危険があります。
規範と記述の混同:「ベイズ的に合理的」という規範的命題と「人間は実際にこう計算している」という記述的命題の区別が曖昧になることがあります。
結論:ガーシュマン計算論の核心
最終的に、ガーシュマンの計算論的認知科学は以下の単一の根本命題に還元できます:
「知性とは制約下での最適推論であり、バイアスはその最適性の表れである。従って知性を理解することはバイアスの計算論的構造を理解することに等しい。」
この命題が成立するならば:
- 「愚かさ」と「賢さ」は同一のシステムの二側面
- バイアスの除去は知性の向上ではなく知性の崩壊
- 知性の改善は「バイアスなき判断」ではなく「適切なバイアスの選択と柔軟な更新」
これは認知科学の問いを超え、知性・合理性・人間性の哲学的再定義を含意しています。
どの方向に議論を続けますか?機械学習理論との接続の深化、あるいは計算論的認知科学と現象学・実存主義との根本的対話、もしくは臨床精神医学への具体的応用—いずれでも掘り下げられます。
