予測符号化理論(Predictive Coding)の歴史

脳を「受動的な情報処理装置」ではなく「能動的な予測マシン」と捉える「予測符号化理論(Predictive Coding)」は、ある日突然一人の天才が提唱したものではなく、異なる分野のアイデアが融合しながら進化してきました。

この理論が「いつ頃から」「どんな形で」知られ、現在のような脳科学・心理学の大ブーム(パラダイムシフト)を引き起こしたのか、その歴史的な流れを4つのフェーズに分けて解説します。


フェーズ1:ルーツとしての「哲学・工学」(19世紀〜1950年代)

アイデアの源流は非常に古く、また意外なところから始まりました。

  • 19世紀のルーツ(ヘルムホルツの「無意識的推論」):
    19世紀のドイツの物理学者・生理学者ヘルムホルツは、「私たちの知覚は、網膜に映った像そのものではなく、脳が過去の経験に基づいて『外の世界に何があるか』を推論した結果である」と考えました。これが理論の精神的な土台です。
  • 1950年代(通信工学でのデータ圧縮技術):
    実は「予測符号化」という言葉自体は、元々は情報工学(データ圧縮技術)の用語です。動画などを送るとき、「すべての画像データを送る」とデータ量が膨大になります。そこで「前の画像から次の画像を予測し、『予測から外れた差分(誤差)だけ』を送信する」という技術が発明されました。これが「誤差だけを伝える」という概念の始まりです。

フェーズ2:脳科学への導入(1999年・歴史的ブレイクスルー)

この情報工学のアイデアが「脳の視覚システムの仕組み」として持ち込まれたことで、歴史が大きく動きます。

  • 1999年:ラオとバラードの論文:
    計算論的神経科学者のR. RaoとD. Ballardが、科学誌『Nature Neuroscience』に歴史的な論文を発表しました。彼らは、人間の視覚野(目で見たものを処理する脳の部位)が、まさに情報工学のデータ圧縮と同じように「上から下へ予測を送り、下から上へ誤差だけを送っている」ことを、コンピューターのシミュレーションで見事に証明しました。
  • どんな形で知られたか?:
    この時点では、あくまで「視覚のデータ処理メカニズムの一つの有力な仮説」として、一部の神経科学者やAI研究者の間で高く評価されました。

フェーズ3:すべてを説明する「大統一理論」へ(2000年代後半〜)

視覚のモデルだった予測符号化を、「生命と脳のすべてを説明する究極の理論」へと押し上げたのが、カール・フリストン(Karl Friston)という一人の天才的な脳科学者です。

  • 2006年頃〜「自由エネルギー原理」の提唱:
    フリストンは、予測符号化を数学的に洗練させ、「自由エネルギー原理(Free Energy Principle)」という壮大な理論を打ち立てました。これは「脳(ひいては生命全体)は、常に環境からの『驚き(=予測誤差)』を最小化するようにできている」という法則です。
  • どんな形で知られたか?:
    視覚だけでなく、聴覚、運動(体を動かすこと)、学習、さらには精神疾患まで、「脳のあらゆる活動が『予測と誤差の最小化』というたった一つの数式で説明できる!」として、神経科学、生物学、AI界隈に激震を走らせました。(※ただし、フリストンの論文は数学的に難解すぎて、当初は限られた天才にしか理解されませんでした)。

フェーズ4:哲学・心理学・一般への爆発的普及(2010年代〜現在)

フリストンの難解な理論が、優秀な「翻訳者」たちによって心理学や哲学に応用され、一般向けの本として出版されたことで、世界的な大ブームとなります。

  • 2013/2016年:アンディ・クラーク(哲学者)
    哲学者のクラークが『Surfing Uncertainty(邦題:予測する心)』という本を出版。難解な数式を使わず、「人間とは予測する機械である」という哲学的な意味を鮮やかに描き出し、人文科学全体に予測符号化を広めました。
  • 2017年:リサ・フェルドマン・バレット(心理学者)
    大ベストセラー『How Emotions Are Made(邦題:情動はこうしてつくられる)』が出版されました。彼女は予測符号化を使って、「怒りや悲しみという感情すらも、生まれつきあるのではなく、脳が身体の内側の変化(心拍数など)を『予測・解釈』して作り出している」と主張し、心理学の常識を覆しました。
  • アニル・セスらの「制御された幻覚(Controlled Hallucination)」:
    「私たちが普段見ている現実は、脳が作り出した予測(幻覚)であり、感覚データ(誤差)によってその幻覚が正しく制御されている状態にすぎない」というキャッチーなフレーズが、TEDトークなどで大バズりしました。

まとめ

  • 1950年代: データ圧縮の「工学技術」として誕生。
  • 1999年: 「視覚の処理モデル」として脳科学に導入される(ラオ&バラード)。
  • 2000年代後半: 脳と生命の「大統一理論」へと昇華する(フリストン)。
  • 2010年代以降: 哲学や心理学に応用され、「感情」や「意識」の謎を解き明かす鍵として、一般書(ベストセラー)やTEDトークを通じて広く社会に知られるようになった。

現在では、自閉症や統合失調症などの精神疾患を「予測と誤差のバランスが崩れた状態」として説明する臨床研究や、次世代のAI(生成AIなど)の基礎理論として、最もホットな学問領域の一つになっています。


予測符号化理論の成立:哲学から計算論的モデルへの系譜

予測符号化理論(predictive coding theory)がどのような形で知られるようになったかというご質問は、この理論の本質を理解するうえで重要な問いです。結論から言えば、予測符号化理論の源泉は19世紀の哲学・生理学にまで遡り、1990年代末の計算論的モデルの登場を経て、2000年代以降に認知神経科学のパラダイムとして広く認知されるようになりました。以下、時代を追ってその展開を整理します。

1. 哲学的・理論的源泉(19世紀〜20世紀半ば)

ヘルムホルツの「無意識的推論」(1860年代)

予測符号化理論の思想的起源は、19世紀ドイツの物理学者・生理学者ヘルマン・フォン・ヘルムホルツに求められます。ヘルムホルツは、知覚が単なる感覚入力の受動的反映ではなく、過去の経験に基づく「無意識的推論(unconscious inference)」の結果であると提唱しました。視覚情報が断片的で曖昧であっても、私たちが安定した世界を知覚できるのは、脳が無意識のうちに「最も確からしい解釈」を推論しているからだという洞察は、現代の予測符号化理論の核心を先取りしていました。

さらに遡る源流:カントの認識論

近年の研究では、この考え方のさらに深い源流として、18世紀哲学者イマヌエル・カントの認識論が注目されています。カントは、人間の経験が感覚入力(内容)とアプリオリな認識形式(枠組み)の合成によって成り立つと主張しました。Swanson(2016)は、カントの超越論的哲学が「知覚は受動的な感覚入力ではなく、能動的な構成過程である」という点で、予測符号化の理論的先駆けであると論じています。知覚を「トップダウン」の能動的過程として捉える視点は、主流の認知科学が長らく採用してきた「ボトムアップ」処理中心のモデルとは異なる系譜に連なるものです。

2. 情報理論と神経科学の接点(1950年代〜1980年代)

「予測符号化」という用語の誕生

「予測符号化」という用語自体は、1950年代の映像信号伝送技術に由来します。テレビ画像の伝送において、全情報を送るのではなく「前フレームからの変化分(予測誤差)」だけを送ることで帯域を節約する技術が「予測符号化」と呼ばれていました。この工学的アイデアが、後に脳の情報処理モデルとして応用されることになります。

効率的符号化仮説

1950〜60年代、Fred Attneave(1954)やHorace Barlow(1961)は、感覚神経系が情報理論的な意味での「効率的符号化」(冗長性削減)を行っている可能性を提唱しました。限られた神経発火のダイナミックレンジの中で、感覚情報を効率的に伝達するためには、予測可能な情報(冗長部分)を圧縮し、予測誤差(新しい情報)だけを符号化することが合理的です。視覚系の側抑制や順応といった生理学的現象は、この枠組みで解釈可能でした。

並列分散処理モデル

1981年、McClellandとRumelhartは、文字認識におけるトップダウン処理(文脈による予測)とボトムアップ処理(感覚特徴)の相互作用を計算論的にモデル化しました。これは、後の予測符号化モデルの重要な先駆けとなります。知覚が「概念(トップダウン)」と「感覚(ボトムアップ)」の相互制約によって成立するという考え方は、1980年代のコネクショニズム運動の中で育まれていきました。

3. 計算論的モデルの登場:理論の「可視化」(1990年代後半)

Rao & Ballard(1999):決定的転換点

予測符号化理論が現代的な形で認知科学・神経科学の注目を集めるようになった決定的な出来事は、RaoとBallardによる1999年の論文「Predictive coding in the visual cortex: a functional interpretation of some extra-classical receptive-field effects」です。

彼らは、視覚皮質における「超古典的受容野効果」(古典的な受容野を超えた文脈の影響)を説明するために、階層的な予測符号化の計算モデルを提案しました。このモデルの核心は:

  • 高次皮質領域から低次領域への「トップダウン予測」
  • 予測と実際の入力との誤差を「ボトムアップ信号」として高次に送信
  • この予測誤差を用いて内部モデルを更新

という階層的ループです。このモデルは、終止停止(end-stopping)などの生理学的現象を統一的に説明できることが示され、理論の生理学的基盤を提供しました。

Grush(2004):エミュレーション理論

Rick Grushは2004年に、運動制御と知覚を統合する「エミュレーション理論」を提案し、予測信号と感覚残差の枠組みを拡張しました。知覚・運動・想像・言語にわたる広範な認知現象を予測符号化の枠組みで説明する可能性を示しました。

4. 理論の拡張と統合:2000年代以降

Fristonの自由エネルギー原理(2000年代〜)

2000年代以降、Karl Fristonによって提唱された「自由エネルギー原理(free energy principle)」は、予測符号化をさらに包括的な理論的枠組みへと発展させました。Fristonは、生物学的エージェントの行動原理を「予測誤差(変分自由エネルギー)の最小化」に一元化する理論を構築。この枠組みでは:

  • 知覚(予測誤差の更新によるモデル適合)
  • 行動(能動的推論:予測を満たすように感覚入力を能動的にサンプリング)
  • 学習(モデル構造そのものの更新)

が同一の原理で説明されます。

「予測処理/予測的処理」への拡張

2010年代には、Clark(2013)『Surfing Uncertainty』やHohwy(2013)『The Predictive Mind』など、哲学者による理論的整備が進み、予測符号化は「予測処理(predictive processing)」あるいは「予測的脳(predictive brain)」というより広いパラダイムとして認知されるようになりました。現在では、知覚研究だけでなく、運動制御、注意、感情、社会認知、精神病理学に至るまで、認知神経科学のほぼ全域に影響を与える統一理論としての地位を確立しつつあります。

5. 日本語圏での受容

日本では、2010年代後半から予測符号化理論に関する紹介や実証研究が増加しています。科学研究費助成事業の課題としても採択されており、例えば内受容感覚(身体内部の感覚)と感情の関係を予測符号化の枠組みで解明する研究などが進められています。

まとめ:理論の系譜

時代発展段階主要な寄与者・出来事
18世紀哲学的源泉カント『純粋理性批判』(知覚の能動的構成)
1860年代生理学的基礎ヘルムホルツ「無意識的推論」
1950-60年代情報理論的基礎Attneave, Barlow「効率的符号化仮説」
1980年代認知科学的基盤McClelland & Rumelhart「並列分散処理」
1990年代後半計算論的モデル誕生Rao & Ballard(1999):視覚皮質の予測符号化モデル
2000年代理論の一般化Grush(2004)エミュレーション理論
2000年代-統合理論へFriston「自由エネルギー原理」
2010年代-哲学的・臨床的拡張Clark, Hohwy らによる理論的整備、芸術療法・精神病理学への応用

このように、予測符号化理論は19世紀の哲学・生理学に端を発する長い思想史を持ちながら、具体的な計算論的モデルとして認知されるようになったのは1990年代末以降のことです。そして現在もなお、理論的洗練と応用範囲の拡大が活発に進められている「進行中の研究プログラム」と言えるでしょう。


タイトルとURLをコピーしました