— ファイルの開始 The Predictive Mind.txt —
概要: 脳が世界を予測する装置であるという立場から、自己・意識・自由意志を再解釈。
The Predictive Mind
Jakob Hohwy
Preface
本書の執筆は、オーストラリア研究評議会およびモナッシュ大学からの貴重な研究支援によって可能となりました。
世界中の多くの研究者からのインスピレーション、実りある議論、そして寛大なコメントに感謝いたします。
モナッシュ大学の同僚たちは私に影響を与え、共に働き、科学の訓練をしてくれました。特に、共著者であるブライアン・ペイトン、コリン・パーマー、ピーター・エンティコット、そして多くのプロジェクトや議論に私を加えてくれたスティーブ・ミラーとトゥルン・ゴ、さらに土屋尚嗣、アナスタシア・ゴルブノワ、マーク・シモンズ、ジョージ・ヴァン・ドーン、アンドリュー・パプリンスキー、レナート・グスタフソン、タマス・ヤントヴィクに感謝します。また、哲学の同僚たちにも感謝します。彼らの多くは繰り返しパイロット研究に引き込まれ、そして研究室で何時間ものラバーハンドイリュージョンのタッピングに耐えてくれた参加者や患者の方々にも感謝します。
オーフスのアンドレアス・ロープストルフのグループは、ブルーオーシャン研究の専門的な航海士であり、多くの点でこの分野への私の関心を引き起こし、可能にしてくれました。アンドレアスに加え、ジョシュ・スキューズには何時間もの議論に感謝します。クリスとウタ・フリスも、時々オーフスに滞在し、偉大で寛大な影響を与え続けてくれています。彼らは、特にデータが手元にあるときの、オープンマインドな学者のパラダイムです。
哲学と神経科学の分野に、予測符号化と脳に関する長時間の議論に耐えてくれる友人がいることは幸運です。ティム・ベインは非常に早い段階で本書の執筆を後押ししてくれ、様々な段階で原稿を読み、広範なコメントをくれました。彼の学術的な寛大さに非常に感謝しています。トーマス・メッツィンガーも同様に、義務の範囲をはるかに超えて、本書の草稿に寛大なコメントを提供してくれました。また、マインツを訪れている間に、トーマスの同僚や学生たちのグループとの多くの議論から大きな恩恵を受けました。東京大学の哲学センターでの一週間の滞在中には、信原幸弘氏とその同僚や学生たちと本書について非常に貴重な議論を楽しみました。アンディ・クラークからは、私の著作やアイデアに対する多くの刺激的で励みになる議論やコメントから大きな恩恵を受けました。ネド・ブロックは、この物語の一部に対して実りある、そして必要な抵抗を示してくれました。ティム・レーンとイェ・スーリン、そして台北の同僚たちは、本書の多くの側面について寛大に議論してくれました。フローリス・デ・ランゲ、シド・クイダー、ラース・マックリとは実りある議論をしました。出版社の匿名の査読者たちは、多くの洞察に満ちたコメントと批判を提供してくれました。
特にカール・フリストンには感謝しています。彼の研究は多くの点で本書にインスピレーションを与えてくれました。カールは数多くの機会に、私の研究に対して辛抱強くフィードバックを提供してくれました。彼は本書の全章を読み、広範なコメントをくれました。彼は学際的なワークショップに参加するために長距離フライトに耐え、多くの点で私の研究に貢献し、仮説検証する脳についての私の理解を深めてくれました。カールが、数学的な厳密さや詳細の多くが翻訳の過程で失われているにもかかわらず、このフレームワークを哲学に翻訳しようとする私の試みにオープンマインドで接してくれることは、非常に励みになります。もちろん、いかなる欠点についても私が責任を負います。
本書は私の家族に捧げます。リンダ・バークレイ、これを書くように励ましてくれ、私の誤りを予測し、共にいてくれたことに。そしてアスカとルーウィー、素晴らしいラバーハンドのモルモットであり、神経発達のインスピレーションであったことに。
Introduction
神経科学において、新しい理論が定着しつつあります。この理論は、実験的および理論的研究を解釈し、推進するためにますます使用されており、心に関する他の多くの研究領域にも浸透しつつあります。それは、脳は洗練された仮説検証メカニズムであり、世界から受け取る感覚入力の予測誤差を最小化することに常に関与しているという理論です。
このメカニズムは、知覚と行動、そしてその間のすべての心的活動を説明することを意図しています。強力な理論的議論がそれを支持しているため、魅力的な理論です。また、ますます多くの経験的証拠がその方向に指し示し始めているため、魅力的です。それは巨大な統一力を持ちながら、詳細も説明することができます。
本書はこの理論を探求します。理論がどのように機能し、どのように適用されるかを説明し、なぜこの理論が魅力的なのかを示し、そして理論の背後にある中心的なアイデアが、知覚、行動、注意、そして心の他の中心的な側面をどのように私たちが考えるべきかを根底から変える理由と方法を示します。
本書の議論
私は心とその世界を知覚する能力に興味があります。私たちが感覚に降りかかる感覚入力の多様性をどのように理解し、それを誤ったときに何が起こるのか、何が私たちの現象学を形成するのか、そしてこれが心の性質について何を教えてくれるのかを知りたいのです。これらの問いに、脳が予測誤差を最小化するという考えに訴えることによって答えようとしています。
本書における私の全体的な議論には3つの要素があります。第一の要素は、この考えが私たちが知覚するという事実だけでなく、私たちがどのように知覚するかをも説明するということです。つまり、この考えは知覚の現象学の重要な側面に直接適用されます。さらに、知覚のこれらの側面を説明するために必要なのはこの考えだけです。私の議論の第二の要素は、この考えが説得力のある理論的機能と単純な機械的実装を組み合わせているために魅力的であるということです。さらに、この基本的な組み合わせは最大限に単純でありながら、非常にニュアンスのある方法で適用される可能性があります。議論の第三の要素は、この考えを心の問題に適用することから何か新しいことを学べるということです。私たちは知覚のメカニズムについて、そして知覚の異なる側面がどのように結びついているかについて何か新しいことを学び、そして知覚し行動する生き物としての自然における私たちの位置について何か新しいことを学びます。
この理論を考察することから私がたどり着く全体像は、心は予測の中に生じ、予測によって形作られるというものです。これは、心のいくつかの興味深い、具体的な側面に翻訳されます。
知覚は、一般に考えられているよりも、世界を理解することに積極的である。しかし、それは奇妙な受動性によって特徴づけられる。私たちの世界との知覚的関係は、感覚入力が提供するものによって強固に導かれる。しかし、その関係は間接的であり、やや当惑させるような脆弱性によって特徴づけられる。脳への感覚入力は知覚を直接形成しない。感覚入力は、脳が発する問いかけへのフィードバックとして、より良く、そしてより不可解に特徴づけられる。
私たちの期待が、私たちが何を知覚し、世界の知覚された側面をどのように統合するかを駆動するが、世界は私たちの期待がどこまで通用するかに限界を設ける。仮説を検証することによって、私たちは世界を正しく理解するが、これは、小さな逸脱が私たちを精神障害に陥らせるように思われる、豊かな統計的プロセスのタペストリーを最適化することに依存する。心は仮説検証者であると同時に法廷でもある。
知覚、行動、注意は、全く同じことを行うための3つの異なる方法にすぎない。世界を正しく理解するためには、これら3つの方法は互いに慎重にバランスが取られなければならない。
意識的知覚の統一性、自己の性質、そして私たちの私的な心的世界に関する知識は、進行中の感覚入力に関する予測を最適化しようとする私たちの試みに、その核心において根ざしている。
さらに根本的に、私たちの知覚状態の内容は、最終的には私たちが何をするか、何を考えるかではなく、私たちが何者であるかに根ざしている。私たちの世界体験とそれとの相互作用、そして私たち自身と私たちの行動の体験は、世界に強固に根ざしていると同時に、感覚入力のベールの背後に危うく隠されている。私たちは因果的に構造化された世界の歯車にすぎず、情報の流れの中の渦である。
この理論は、私たちが何者であるか、そして私たちの心的生活の側面が世界にどのように適合するかを根本的に再概念化するだけでなく、これらのテーマを一つの考えの下に統一することを約束する。すなわち、私たちは世界のモデルに基づいて生成された仮説と、世界から来る感覚的伝達との間の誤差を最小化するのである。脳全体で繰り返される単一のタイプのメカニズムが、すべてを管理する。このメカニズムは、誤差を最小化するために標準的な統計ツールの詰め合わせを使用し、そうすることで知覚、行動、注意を生み出し、これらの現象の不可解な側面を説明する。メカニズムの説明は統計的であるが、それは単なる因果的な神経メカニズムであり、したがってこの理論は、心の還元的、唯物論的見解とよく適合する。
このような説明的可能性を秘めた理論は非常に刺激的です。この興奮が本書の動機です。そのメッセージは、この理論はその約束を果たし、心を新しい光の下で見ることを可能にするということです。
私は、脳と心へのこのアプローチの他の多くの側面が探求され、探求されるであろうと確信しています。本書は、生命と心へのこの種のアプローチの影響を決して網羅するものではありません。私は知覚の重要な問題に焦点を当てますが、思考、イメージ、言語、社会的認知、意思決定といったより高次の認知現象はほとんど除外します。また、社会学、生物学、進化論、生態学、基礎物理学との理論の関係に関するより広範な問題もほとんど脇に置きます。それでも、本書でやるべき仕事はたくさん残っています。
本書の構成
本書は3つの部分から構成されています。第一部は、神経科学および計算理論の研究者、特にカール・フリストンと彼の大きな協力者グループの研究に基づいています。一連の章で、予測誤差最小化メカニズムが動機づけられ、記述され、説明されます。私たちは非常に単純な知覚のベイズ的概念から始め、世界のさまざまな状態とその精度の統計的推定に敏感なベイズ推論を可能にし、文脈感受性とモデルの複雑さに余地を与えるコアメカニズムで終わります。この全体的な見解が魅力的なのは、部分的には、たった一つのメカニズムに訴えるからです。これはしたがって、非常に野心的な統一プロジェクトです。
この研究分野は数学的に重厚であり、これが実際、その影響力が増大している理由の一部です。数式は形式的な厳密さと定量的な予測の可能性を提供します。しかし、私の説明は、技術的、形式的な詳細を最小限に抑えて行われます。私は非常に一般的なベイズ的および統計的な考えに訴え、説明します。これは数学的な美しさを無視しますが、認知科学と哲学における概念的および経験的なパズルへの議論をよりアクセスしやすくし、適用しやすくするでしょう。
私の主な関心は、予測誤差最小化メカニズムの重要な要素、特に、予測誤差がどのように発生し最小化されるか、予測誤差の精度に関する期待がどのように処理されるか、複雑さと文脈依存性がどのように考慮されるか、そして行動がメカニズムの不可欠な部分である方法を明らかにすることです。さらに、このメカニズムが脳全体で階層的にどのように繰り返されるかを説明します。これらは他のすべてを説明するために必要な要素であり、あまり形式的な詳細なしに公正に伝えることができます。第1章の終わりにベイズの定理の簡単な入門を、第2章の注にいくつかの初歩的な形式的詳細を記述します。また、時々、非常に最小限の形式的表現を提供しますが、これは主に、より複雑な点がより単純なベイズ表現とどのように関連するかを思い出させるためのものです。これらのより形式的な要素は、全体的な議論の流れにとって不可欠ではありませんが、この理論の広大な数学的背景を示すものとして役立ちます。
予測誤差最小化フレームワークは、自由エネルギー最小化という基本的な概念に一般化することもできます。予測誤差最小化という単純で認識論的に焦点を当てたバージョンの知覚の問題を超えて議論を進める際には、この概念に間接的に訴えますが、一般的にこのより広範な自由エネルギーの概念を私の議論で使用したり、そのより広い結果について深く掘り下げたりはしません。これは、私が集中する心の側面が、何よりもまず、ベイズ的仮説検証というより直接的に認識論的な概念に訴えることによって最もよく理解できるからです。しかし、根本的には、これらの形式的フレームワーク間に違いはありません。
第二部では、世界の事態の知覚に関する認知科学における長年の議論、すなわち、結合問題と、私たちの事前信念が知覚をどの程度形成するかについての議論に対する、基本的な予測誤差最小化メカニズムの結果を検証します。仮説検証する脳の理論は、これらの議論を通じて興味深い道筋を描き出すことができます。この部分では、現実検証と予測誤差最小化の微調整に関する多面的な見解を提示し、それが次に精神障害と関連付けられます。
私はこれらの問題を、結合問題、認知的不可侵性、精神疾患などに関する広範な文献のあらゆる側面を完全に説明するわけではありませんが、フレームワークがそれらを理解するのに実りあるものであることを確立するのに十分な詳細レベルで扱います。これらの議論の多くを、心理学と認知神経科学からの経験的研究の例、私自身が直接関わったものも含めて例示します。
本書のこの部分は、この心の記述には一つの基本的なメカニズムしかないにもかかわらず、その説明的範囲が非常に印象的で啓発的であることを示します。第二部の最終章は、誤った表象、規則遵循、表象、理解に関する、より哲学的な議論のセットの中でこのプロジェクトを続けます。
第三部では、哲学と認知科学において深く、扱いにくい議論を煽ってきた、私たちの心的生活のいくつかの興味深い側面について、予測誤差最小化メカニズムが何を教えてくれるかを探求します。繰り返しになりますが、この理論の極端な説明的野心(それは脳の基本原理を与えることになっている)を考えると、それが心のすべての側面に適用されることを期待すべきです。
まず、私はそれを注意とその意識的知覚とのよく理解されていない関係に適用します。次に、私たちの知覚的生活の興味深く不可解な側面である、意識的知覚の統一性に関する説明においてこの理論に訴えます。最後から2番目の章では、知覚し行動する生き物としての、世界に対置された私たちの全体的な位置の感覚を、この理論的フレームワークがどのように与えることができるかを探求します。最後に、私はより手綱を緩め、このフレームワークが感情、内省、意識の私秘性、そして自己にどのように拡張されるかについて推測します。
この理論の中心にある予測誤差最小化という単純な概念は、これらの種類の深い問題に興味深い結果をもって取り組むことができるだけでなく、重要なことに、私たちの心的生活のこれらの非常に多様な側面を一つの原理の下に統一することができるように思われます。
全体として、これは私たちを、心の多くの不可解な側面について新しく驚くべき理解を与える、統一された自然主義的な記述に近づけます。脳を仮説検証者として考えることは、私たちが心の仕組みと世界を知る方法に関する多くの問題や直感的な考えを再評価し、再調整し、再概念化することを可能にします。
背景
予測誤差最小化の説明を取り巻く形式的な機構はごく最近開発されたものですが、その中心的な考えは新しいものではありません。それは千年前、イブン・アル・ハイサム(アルハゼン)(約1030年;1989年)によって予期されていました。彼は「多くの目に見える特性は判断と推論によって知覚される」(II.3.16)という見解を展開しました。また、脳が世界の先行概念(空間と時間の直観形式、カテゴリーなど)を用いて感覚系に直面する混沌とした感覚的多様性を組織化することで知覚が生じるという考えには、間違いなく明確なカント的要素があります(カント 1781年)。私たちの思考(あるいは推論)と感覚から送られてくる多様な内容との関係は、「内容なき思考は空虚であり、概念なき直観は盲目である」というカントのスローガンに捉えられています。「悟性は何も直観できず、感性は何も思考できない。両者の合一によってのみ知識は生じうる」(A51/B75)。
しかし、カントへの直接的な反応として、脳が仮説検証者であるという考えを初めて捉えたのはヘルマン・フォン・ヘルムホルツでした。彼は、カント的な考え方では、「我々自身の神経系の感覚の世界から、現実のものの世界へといかにして脱出するのか」ということを心配していました(ヘルムホルツ 1855年;1903年;カントとの関係については、Lenoir 2006年参照)。彼の答えは、基本的には、私たちが自然に問いかけ、自然が与える答えによって導かれるということです。これは、事前の学習に基づく無意識の知覚的推論を用いて行われます(ヘルムホルツ 1867年)。この種の推論こそが、知覚を世界に根付かせるのです。
この brilliantly で非常に単純なアイデアは、仮説検証する脳に関する現代の形式的・経験的探求の核として残っています。ヘルムホルツのアイデアは20世紀を通じて様々なテンポで取り上げられ、発展しました。ジェローム・ブルーナーの「ニュー・ルック」心理学は、事前信念が知覚に与える影響を考察しました(Bruner, Goodnow et al. 1956)。これはジェリー・フォーダーとゼノン・ピリシンによって挑戦されましたが、両者とも(低レベルの)無意識的推論という基本的にヘルムホルツ的な概念は受け入れています(Fodor 1983; Pylyshyn 1999)。ウルリック・ナイサー(1967)は、カント的な感触を持つ「分析による統合」という概念を発展させました。アーヴィン・ロック(1983)はこのようなアイデアをさらに発展させ、リチャード・グレゴリー(1980)は自身の知覚の説明をヘルムホルツの仮説検証への訴えに明示的にモデル化しました(概要と議論については Hatfield 2002 参照)。これらのアイデアを活用するための形式的装置は、ホレス・バーロウによって予示され(Barlow 1958; Barlow 1990)、ラオ、バラード、マンフォード、ダヤン、ヒントンなど、計算神経科学と機械学習の多くの研究者によって開発されました。一方、知覚へのベイズ的アプローチは、カーステン、ユイル、クラーク、エグナー、ママシアンなど多くの人々によって探求され、発展しました(有用な入門書やテキストには (Knill 1996; Dayan and Abbott 2001; Rao, Olshausen et al. 2002; Doya 2007; Bar 2011) があります)。また、Bubic, Von Cramon et al. (2010)、Huang and Rao (2011)、den Ouden, Kok et al. (2012) などによるフレームワークの最近の解説や議論もあります。クリス・フリスの素晴らしい『Making Up the Mind』(2007)は、仮説検証する脳の多くの側面を議論し、関連する経験的研究の非常に多くの例を提供しています。
予測誤差最小化の物語に関連する歴史的な底流は、因果関係と帰納的推論の理解の発展に関係しています。デイヴィッド・ヒュームはこの点で極めて重要な人物です。彼は「原因とは、ある対象に続いて別の対象が現れ、最初の対象に似たすべての対象に、二番目の対象に似た対象が続くものである。言い換えれば、最初の対象がなければ、二番目の対象は決して存在しなかったであろう」と定義しました(Hume 1739-40: 146)。ヒュームにとって、因果関係とは、統計的データを抽出することと、世界に制御された方法で介入した場合に何が起こるかを想像することの両方です。この二重の定義は、ルイスによる因果関係の反事実的扱いで強調され(Lewis 1973)、ウッドワードによる介入下での不変性という観点からの因果関係の本格的な分析で発展しました(Woodward 2003)。これは、ヒュームの基本的な考えの両側面に関するパールの独創的な研究と並行しています(Pearl 1988, 2000)。統計的規則性を抽出するという概念と、介入をモデル化するという概念の両方が、無意識の知覚的推論の概念において大きな役割を果たしています。
おそらく、因果の物語と仮説検証の物語の両方の現代的な発展の合流が、予測誤差最小化の概念を開発し、今やそれを適用して、私たちの心の概念を変容させることを見ることができるほどにまで可能にしたのでしょう。
心の哲学と認知の分野で、この種の理論の側面についての議論は過去60~70年にわたって行われてきましたが、この理論の最新の具体化に関する哲学的な研究はほとんど行われていません。ドレツキーの影響力のあるアプローチに部分的に基づいて(Dretske 1983)、表象の統計的な考えを伝統的な哲学的議論に結びつけるという点での先駆者は、クリス・エリアスミスとマリウス・アッシャーです(Eliasmith 2000; Usher 2001; Eliasmith 2003, 2005)。リック・グラッシュも同様の方向で貢献し、例えば、この基盤の上に時間意識に関する説得力のある理論を展開しています(Grush 2004, 2006)。アンディ・クラークは現在、このフレームワークを非常に興味深い方法で発展させており、その広範な影響を示し、重要な点で、私が本書で論じる方向とは異なる方向にこのフレームワークを導いています(Clark 2012a, 2013)。認識論の分野では、ハンス・ライヘンバッハ(1938)の、立方体の宇宙の中から外部世界の存在を推論するという例に焦点を当てた興味深い関連研究があり、最近エリオット・ソーバー(2011)によって、このフレームワークの重要な要素を予期するベイズ的および因果的な観点から議論されています。
予測誤差最小化理論は、多くの点で分類が困難です。それは主流であると同時に、全く物議を醸すものです。一方では、アル・ハイサムやヘルムホルツなどと共に、心理学と神経科学のまさに歴史的な核に位置し、グレゴリー、ロック、ナイサーなど多くの人々によって、この種のアプローチは現代において大きな支持を得ています。他方では、それは非常に極端な説明的野心を持っているため、私たちの期待や事前知識が知覚を形成したり導いたりすることを認める以上に、それを支持する人は比較的少ないです。多くの人は、予測が知覚において役割を果たすという一般的な考えには同意するでしょうが、予測誤差最小化が脳が常に行っている唯一のことであり、行動と注意がそのような最小化に他ならないということに同意する人は少ないでしょう。さらに少ない人が、これが人間のような生物が自己組織化する方法の表現であり、さらに、これが本質的に変分自由エネルギーに基礎を置き、統計物理学と直接的なつながりを持つものであることに同意するでしょう!
神経科学の研究では、この概念への根本的な譲歩はほとんど見られません。代わりに、教科書の説明では、知覚は主にボトムアップの感覚信号における特徴検出の観点から説明されており、脳内の圧倒的な量の逆方向の接続には強い役割が与えられていません。この逆方向の接続は、予測誤差スキームにおいて予測を媒介すると考えられています。対照的に、計算神経科学と機械学習の教科書は、私がここで議論する理論の側面をはるかに超える詳細な表象学習に関する章を日常的に含んでいます。この考えに触発された、あるいはこの考えに照らして結果を議論する発表された研究の数が増加していることから判断すると、数年もしないうちに何らかのバージョンの理論が神経科学で支配的になると思いますが、この予言はもちろん経験的な運次第です。
認知科学と機械学習の分野では、予測誤差最小化スキームのバージョンは、言及したように、広く認識されています。このスキームの一部は、コネクショニズム、特に、入力データを分類するための誤差修正方法であるバックプロパゲーション・アルゴリズムを持つニューラルネットワークの構築にルーツを持っています(Rumelhart, Hinton et al. 1986)。しかし、それは、教師付きではない(したがって、ラベル付けされた訓練データを必要としない)という点で、バックプロパゲーションとは中心的な点で異なります。予測誤差最小化は、ボトムアップデータを分類するのではなく、トップダウン方式でデータを生成するモデルを使用します。さらに、生成的モデルの使用は、深い階層的設定ではるかにうまく機能します(Hinton 2007)。これらの側面は、このスキームを以前のコネクショニストの考えとは明確に区別し、私が本書全体で焦点を当てる議論の多くを支えています。
予測誤差スキームは、認知科学における2つの対立する傾向の間で、かなり良い位置にあるように思われます。一方には、認知プロセスの概念的・機能的分析から始まり、次に脳のモデルをリバースエンジニアリングしようとするトップダウンのアプローチがあります。他方には、生物学的に触発されたニューラルネットワークを構築し、そのようなネットワークがどのような認知機能を実装するかを学ぼうとするボトムアップのアプローチがあります(Griffiths, Chater et al. 2010; McClelland, Botvinick et al. 2010)。哲学者として、私は自然と概念分析から始める傾向があり、実際、本書はその方向で始まります。しかし、このスキームの大きな魅力の一つは、それが非常に機械論的なアプローチに適していることです。より多くの証拠が必要ですが、それは脳の全体的な解剖学的・生理学的な事実と、それがどのように機能するかとよく合っています。特に、それは脳内の比較的明確な順方向の信号伝達の全体的な流れに触発されており、それは大規模でより拡散した逆方向の信号と出会います。それは脳の機能的分離と接続性によく合っています。そして、異なる機能的要素は、脳の異なる種類の可塑性に非常によく適合しています。これは私の科学者としての側面に訴えかけます。この組み合わせは魅力的なパッケージを提示します。
私自身の仮説検証する脳への旅は、イアン・ゴールドと私が妄想形成の理論に取り組んでいたときに始まり(Gold and Hohwy 2000)、2001年頃にアンドレアス・ロープストルフと私がオーフスで共同研究を始めたときに本格化しました。雑多な学際的グループと共に、私たちはこのフレームワークを解読し始め、その説明的可能性を評価し、それが多くの異なるトピックにどのように適用されるかを考え始めました。クリス・フリスの研究に触発され、私はまず神経精神医学の問題を通じてそれを探求し(Hohwy 2004; Hohwy and Frith 2004; Hohwy and Rosenberg 2005)、その後、自己(Hohwy 2007b)のようなより広範な問題や、認知機能と知覚機能の概念に対する一般的な結果を考察しました(エリアスミス(2007)とフリストンとステファン(2007)による重要な貢献を含むSyntheseの特集号(Hohwy 2007a)を参照)。それ以来、私は視覚知覚、内省、感情のコア機能、そして注意を考察してきました(Hohwy, Roepstorff et al. 2008; Hohwy 2011; Hohwy 2012)。これらすべての場合において、私はフリストン、フリスなどの研究に依存し、特定の問題に対する結果を発展させてきました。これらのテーマの多くを統一するだけでなく、一歩引いて、このフレームワークが心について何を言っているのか、より全体的な感覚を得る時が明らかにきました。
本書について
本書は、哲学者、神経科学者、心理学者、精神科医、認知科学者、コンピュータ科学者、そして心の性質に興味を持つすべての人を対象としています。このフレームワークに馴染みのない読者は、その核心にある基本的なメカニズムの私の簡略化された表現を通して、また、それがさまざまな問題事例にどのように適用されるかを見ることによって、それを理解することができます。すでにこのフレームワークに馴染みのある読者は、それが心理学や認知科学全般の広範なトピック、さらには哲学的な問題とどのように結びつくかに興味を持つでしょう。
私は哲学的な専門用語をあまり使わずに、哲学的な議論を説明するように努めました。経験哲学や神経哲学からのトピックが本書全体に浸透していますが、より直接的に哲学的な議論の多くは第8章にまとめています。時には詳細な議論を提供し、時には約束手形、あるいはさらなる研究への招待という形で提供します。本書の強みは、私が願うに、個々の提案と同じくらい、提案の組み合わせたパッケージにもあります。また、神経科学や精神物理学の研究を、率直でアクセスしやすい言葉で記述するように努力しました。ここで理論の新しい経験的証拠を提供するわけではありませんが、私の扱いが、心の哲学と認知科学におけるいくつかの扱いにくい問題や議論を解決し、明らかにする、広範で統一的な説明を提供することによって、この理論を支持すると信じています。
各章の終わりに注を配置しました。これらは、参考文献やさらなる読書のための提案、テキストの出典、関連する追加の経験的証拠の簡単なレビューを提供します。いくつかの注には、問題の章の主要な議論にとって重要ではないが、議論されているより広範なトピックの重要なさらなる側面に関する簡単な議論が含まれています。それらを注として含めたのは、それらが本書の主要なテーマとどのように関連するかを示すためです。最後に、いくつかの注は、概念的なフレームワークが依拠する形式的および数学的な機構のいくつかの基本的な記述を提供します。
第一部
メカニズム
1
因果推論としての知覚
私たちの感覚は、世界のものからの入力で絶えず攻撃されています。その入力に基づいて、私たちはそこにあるものを知覚します。私たちがこれから取り組む問題は、脳がこの知覚という偉業をどのように達成するかです。
本章は、脳が知覚するために推論を用いなければならないという考え、すなわち脳は推論メカニズムであるという考えを追求します。第一の目的は、なぜ私たちがこれに同意すべきか、そしてそのような知覚的推論の重要な要素は何かを示すことです。第二の目的は、推論がどのようにして知覚の現象学を支えることができるかを示すことです。
知覚の問題を非常に基本的で有用に定式化する方法は、原因と結果の観点からです。世界の事態は脳に影響を与えます。世界の対象やプロセスは感覚入力の原因です。知覚の問題は、その結果、つまり脳がアクセスできるすべての感覚データを用いて、原因を突き止める問題です。したがって、それは脳にとっての因果推論の問題であり、私たちの日常的な原因と結果についての推論や、科学的な因果推論の方法と多くの点で類似しています。
知覚の問題が問題であるのは、既知の結果だけからその隠された原因へと遡って推論することが容易ではないからです。これは、同じ原因が私たちの感覚器官に非常に異なる結果を生じさせることがあるためです。自転車を見ることと単に触れること、あるいは異なる視点から見ること、あるいは完全に見える場合と茂みの後ろに部分的に隠れている場合とで得られる非常に異なる入力を考えてみてください。同様に、異なる原因が私たちの感覚器官に非常に似た結果を生じさせることもあります。自転車と単なる自転車の写真、あるいは茂みによって遮蔽された完全な自転車と茂みの周りに散らばった自転車の部品、あるいはもっと奇抜な可能性として、それが自転車のような感覚的印象を引き起こしている異常にうまく協調した蜂の群れであるといった、潜在的に同一の感覚入力を考えてみてください。
私たちの複雑な世界では、原因と結果の間に一対一の関係はありません。異なる原因が同じ種類の結果を引き起こすことができ、同じ原因が異なる種類の結果を引き起こすことがあります。このため、脳が一つの原因(世界の中の対象)に対応する一つの結果(感覚入力)を選ぶことが困難になります。もし脳の因果推論に対する唯一の制約が即時の感覚入力であるならば、脳の視点からは、どの因果推論も他のどの推論と同じくらい良いものとなります。入力が異なる場合、例えば見たり感じたりした自転車の場合のように、脳は入力の原因が同じであるか、あるいは異なる原因があるか、そして一方の種類の原因が他方よりありそうかどうかを知ることはできないでしょう。
知覚的推論への制約
したがって、重要な問題は、追加の制約がなければ、脳は感覚入力に関する信頼できる因果推論を実行できないということです。私たちは実際にはそのような推論に従事することができます、なぜなら私たちは知覚できるからです。ですから、そのような追加の制約があるに違いありませんが、それは何でしょうか?
一つの可能性は、追加の制約が単なるバイアスであるということです。脳は、それが一つの原因ではなく別の原因であると確実に推論することはできなくても、単に一つの原因を支持するようにバイアスがかかっているだけです。たまたま、ある種の入力を得たときに、自転車が原因であると判断するのです。間違いなく、自然界には記述可能な、法則的な規則性があり、特定の、指定されるべき条件下で、脳のようなシステムが自転車によって引き起こされる特定の種類の感覚入力をした場合、それは自転車として知覚するようにバイアスがかかるでしょう。原理的には、科学の様々な分野が、脳のようなシステムを体系的に自転車の入力にさらし、脳全体の因果連鎖を追跡することによって、これらのバイアスを発見することができるでしょう。脳は、原因と結果の間の手に負えないほど多くの可能な関係の中から一つを日和見的に支持することによって、知覚の問題を切り抜けているように見えるでしょう。
しかし、ある記述レベルでこれらの規則性があったとしても、それは私たちが考えたような知覚の問題を解決するものではありません。そのような規則性は、知覚を因果推論として理解することを与えてくれません。推論は規範的な概念であり、単なるバイアスは、自転車への推論と、例えば、群がる蜂が感覚入力の原因であることへの推論との間に質の差がありうることを理解させてはくれません。自然界の単なる規則性が私たちに与えるのは、システムが何をするかについての物語であり、世界を正しく理解するために何をすべきかではありません。したがって、必要なのは、そのような規則性の役割に対する規範的な理解です。私たちは、因果推論に対する追加の制約を規範的な観点から見る必要があります。
規範的な影響を持つ追加の制約として、明確な最初の候補があります。自転車のようなものについての因果推論が、膨大な事前信念のレパートリーに基づいていることは明らかです。これが、現在の感覚的印象の原因が蜂の群れであるといった候補となる原因のいくつかを低くランク付けすることを可能にするものかもしれません。私たちの事前の経験は、蜂が実際に私たちにそのような感覚入力のパターンを形成することは極めてありそうにないことを教えてくれます。実際、知覚的な因果推論が事前知識によって補強される必要があることに疑いはほとんどありませんが、そうすることは些細な問題ではありません。一方では、もし私たちが語る物語が、私たちが単に事前信念のストックを持っているというものであれば、私たちは結局、単なるバイアスの話を超えていません。他方では、もし事前知識自体が事前の知覚的、因果的推論の産物であるならば、私たちは説明しようとしていること、すなわち知覚的因果推論を前提としています。カーペットの隆起が単に移動しただけです。
これで、知覚の問題の解決策が何をしなければならないかがわかります。それは、知覚的推論と事前信念が一度に説明され、規範的であると説明され、頭蓋骨に縛られた脳の視点を超えて答えを自分で手に入れることなく、ブートストラップ効果を持たなければなりません(Eliasmith 2000; Eliasmith 2005)。まさにそのような解決策の輪郭が今、現れ始めています。それは確率論、つまりベイズ認識論に基づいており、それは私たちの証拠を考慮して、私たちが何を推論すべきかについて何かを教えてくれるので規範的です。
知覚とベイズの定理
この非常に単純なシナリオを考えてみてください。あなたは窓も本もインターネットもない家にいます。あなたはコツコツという音を聞き、何がそれを引き起こしているのかを突き止めなければなりません(図1)。
これは基本的な知覚的課題を示しています。あなたは脳のようで、家は頭蓋骨、そして音は聴覚的な感覚入力です。入力の原因について考えているうちに、入力の考えられる原因をリストアップし始めます。それはキツツキが壁をつついているのかもしれないし、風で枝が壁を叩いているのかもしれない、泥棒が錠をいじっているのかもしれない、通りの先で大規模な道路工事をしているのかもしれない、隣人のうるさい音楽かもしれませんし、あの子供たちが石を投げているのかもしれません。あるいは、緩んだ水道管が互いにぶつかり合っているような内部的な何かかもしれません。想像力を働かせてみましょう。あなたの家が夜の間に宇宙に打ち上げられ、その音は隕石のシャワーによって生み出されているのかもしれません。考えられる原因に終わりはありません。これらの可能性のそれぞれを仮説と呼びましょう。知覚の問題は、世界に関する正しい仮説がどのように形成され、選択されるかです。

仮説を生成し始めると、いつ止めるべきか明確な原則がないという問題はさておき、代わりに、私たちが仮説を生成でき、そしてどんな仮説でも関連性があるように見えるわけではないという事実に注目してください。例えば、あなたの家のコツコツという音が、遠くの数学者がゴルトバッハの予想について熟考していることや、昨日の天気によって生み出されているとは受け入れないでしょう。これは、私たちが仮説と問題の効果との間の関連を理解できることを意味します。私たちは「もし本当にキツツキなら、確かにこの種の音を引き起こすだろう」と言うことができます。私たちは、仮説が効果にどれだけ適合するかについて何かを言うことができます。これが尤度(likelihood)です。仮説で記述された原因がそれらの効果を引き起こす確率です。そのような尤度の評価が、世界の因果的規則性の仮定(例えば、キツツキの典型的な効果)に基づいていることは明らかです。世界の因果的規則性に関する私たちの知識に基づいて、私たちはしばしば仮説を尤度に従って、つまり、説明しようとしている効果との結びつきの強さに従ってランク付けすることができます。そのようなランク付けは、仮説が効果を説明したり、予測したりするのにどれだけ優れているかを捉えていると言えます。例えば、キツツキ仮説は、配管がぶつかる仮説とほぼ同じ尤度を持つかもしれず、どちらも石を投げる子供たちに関する仮説よりも高い尤度を持ちます。
高い尤度を持つ仮説のみを考慮することに制約を設けることで、知覚の問題を単純化することができます。しかし、それでもなお、非常に多くのものが原理的に問題の効果を引き起こしうるため、高い尤度を持つ仮説は依然として非常に多く存在するでしょう。単に最も高い尤度を持つ仮説に従うだけでは、良い因果推論は保証されません。ここに非常に高い尤度を持つ仮説があります。その音は、狡猾な神経科学者があなたを使って知覚的因果推論を説明するために特別に設計したタッピングマシンによって引き起こされている、というものです。この仮説は聴覚的証拠に非常によく適合しますが、実際の多くの状況では良い説明とは思えません。問題は、狡猾な神経科学者仮説が、それ自体で考慮した場合、そしてあなたが叩く音を聞く前に考慮した場合、非常にありそうにないように思えることです。
したがって、私たちは仮説の独立した、事前の妥当性を、その尤度に加えて考慮する必要があります。証拠との適合性を考慮する前に、仮説の確率を考慮する必要があります。これが、仮説の事前確率です。おそらく、各仮説がどれほど確からしいかについて、それが記述する出来事の頻度に基づいた客観的な真実があるでしょう。この種の知識は有用でしょうが、ほとんどの場合、私たちが持っているものではありません。代わりに、私たちはあなたがあなた自身の背景的信念と主観的な推定に基づいて仮説に確率を割り当てると仮定します(確率の合計が1になるようにして、ランキングを意味のあるものにします)。
あなたの事前信念に訴えることで、音の原因を突き止めるための2つのツールをあなたに与えました。尤度、それはあなたが今考えている特定の仮説を考慮した場合に家で観察する効果の確率です。そして、仮説の事前確率(あるいは単に「事前確率」)、それはあなたが現在観察している効果とは無関係に、その仮説がどれほど確からしいかというあなたの主観的な推定です。
観察された効果に最も適合するが、その仮説の独立した確率によって重み付けされた仮説を選ぶことが合理的だと思われます。尤度と事前確率は、確率論の定理であり、多くの人によって合理性のパラダイムと考えられているベイズの定理の主要な要素です。このルールは、与えられた仮説(例えばキツツキ仮説)の確率を、ある証拠(例えばコツコツという音を聞くこと)を考慮して更新することを教えてくれます。それは、尤度(仮説が与えられた場合の証拠の確率)と仮説の事前確率の積を考慮することによって行われます(確率の合計が1になるように正規化されます)。結果として得られる仮説への確率の割り当ては、事後確率として知られています。最良の推論は、したがって、最も高い事後確率を持つ仮説への推論です。(本章の終わりにベイズの定理の簡単な入門が含まれています)。
さて、あなたが家で聞く音に戻りましょう。尤度と事前確率があれば、良い仮説にたどり着くことができます。それは、最も高い事後確率を達成するものです。もしあなたの地域で多くのキツツキを経験し、泥棒は数人しか経験しておらず、あなたの家が夜の間に宇宙に打ち上げられたとは本当に思っておらず、などなどであれば、あなたはキツツキ仮説を推論することになるはずです(図2)。
この非常に単純化された提示の上でさえ、ベイズ推論は知覚について考える非常に自然な方法を提供します。もちろん、私がここで問題を説明した方法の欠点は、頭蓋骨の中に意識的に因果推論を行う知的な小人がいないということです。私たちがこれから展開する物語、それはヘルムホルツに遡りますが、そこでは、実際に起こっていることは、神経機構が無意識のうちに知覚的推論を行っているということです。ヘルムホルツが知覚に至る「精神的活動」について言うように、
[それらは]一般に意識的ではなく、むしろ無意識的である。その結果において、それらは推論に似ている。なぜなら、私たちは感覚に観察された効果から、この効果の原因についての考えに至るからである。これは、私たちが実際には常に神経での出来事にしか直接アクセスできない、つまり、効果を感じるだけで、外部の対象を決して感じないにもかかわらず、そうなのである(ヘルムホルツ 1867: 430)。

したがって、私たちが話しているのは無意識の知覚的推論です。私たちの前の仕事は、システムが行うことがどのように推論の一形態として有用に考えられるかを見ることです。私たちは、脳が無意識のうちに、施錠された家の中で聞こえる音の原因を突き止めるために記述したのと同じ種類の推論を行うことができるというヘルムホルツ的な考えを受け入れるだけでよいのです。脳はベイズの定理を用いて感覚入力の原因を推論します。それが知覚する方法です。核となる考えはかなり明確で、心地よい一般性を持っています。知覚の問題は本質的に特別なものではなく、全く新しい科学分野が必要なものではありません。それは、むしろ、私たちが科学と日常生活の両方でしばしば直面する種類の因果推論問題の一つのバージョンにすぎません。
ベイズ的で推論的な知覚へのアプローチは魅力的ですが、多くの疑問がすぐに生じます。まず、知覚を理想的に合理的で、確率的で、科学的なスタイルの推論と一致させることは、やや知的主義的に見えます。確率論を学び、ベイズ推論を実装することは困難ですが、知覚は無意識で楽です。それは大人、子供、動物がベイズについて何も知らなくてもできることです。さらに、私たちが明示的なベイズ推論にあまり長けていないという証拠があります。ベイズの定理は説明と練習が必要で、私たちに自然に備わっているようには思えません(Kahneman, Slovic et al. 1982)。また、脳が物事を「推論」したり、「信じ」たりすると言うことには、少し奇妙な点があります。私たちがベイズを知らないのに、脳はどのような意味でベイズを知っているのでしょうか?
そもそも、知覚へのベイズ的アプローチは、単なる概念的なラベリングや原因の分類ほどには、知覚の現象学の完全な豊かさに直接関わっているようには見えません(それは、自転車を視覚的に体験することよりも、単にいくつかの感覚入力を「自転車」とラベリングすることに関するように思えるかもしれません)。また、主観的な確率を割り当てることに焦点を当てたこのアプローチは、事前信念がどこから来るのかについて満足のいく説明をすぐに提供し始めるわけでもありません。この章と次の章で見るように、理論的なフレームワークは、これらの問題すべてに対処するように発展させることができます。
推論的な知覚の描像とは対照的なのは、知覚が、仮説検証する脳における推論プロセスの結果ではなく、低レベルの感覚刺激から信号が回復され、徐々に一貫した知覚へと組み立てられる、分析的でボトムアップ駆動のプロセスの結果であるという描像です。この代替的な、非推論的なアプローチでは、知覚は、脳が世界から得る入力で検出する特徴によってボトムアップで駆動されます。乱暴に言えば、入力の変化が知覚の変化を駆動するのであり、したがって、いかなる実質的な、規範的な意味でのトップダウン推論も必要ありません。
特徴検出アプローチと、より推論主義的なベイズ的アプローチの相対的な長所については多くの議論があります(レビューと議論については、Rescorla (in press) を参照)。特徴検出アプローチを採用しない理由の一つは、それが上記で設定したような知覚の問題にどのように役立つかが明確でないことです。この理論的な議論はここで決定的に解決することはできませんが、次のセクションでは、推論の必要性を示す知覚効果の非常に良い例を挙げます。
知覚的推論と両眼視野闘争
1593年、イタリアの博学者ジャンバッティスタ・デッラ・ポルタは、興味深い視覚現象を報告しました。
目の間に仕切りを置き、一方を他方から分離し、右目の前に本を置き、読む。もし別の本が左目の前に置かれると、それは読めないだけでなく、ページすら見ることができない。ただし、視覚の力が右目から引き抜かれ、左目に移された場合は別である(Porta 1593; Wade 1998: 281より引用)。
数世紀後、チャールズ・ホイートストンは、目に提示される画像を分離するのに役立つ鏡を使用したステレオスコープを発明し、1838年には、各目に示された異なる文字間のこの種の知覚的交代も記述しました(Wade 1998; Wade 2005)。この魅力的な効果は両眼視野闘争として知られており、ポルタから400年後も、視覚科学における多くの研究の活発な焦点であり続けています。その背後にある神経メカニズムはまだ知られておらず、新しい興味深い発見を生み出し続けています。ポルタが愉快に表現するように、何が「視覚の力」を目と目の間で交代させるのでしょうか?
これは驚くべき効果です。なぜなら、もし二つの異なる画像が目に示されれば、それらはどうにかしてお互いに混ざり合うべきだと考えるでしょう。もし家の写真が一方の目に、顔の写真がもう一方の目に示されれば、人はきっと顔と家の合成物を見るはずです。しかし、ポルタやホイートストン、その他多くの人々が記述したように、そうはなりません。脳はどういうわけか、そこに二つの異なるもの、顔と家があると判断するように見え、そして知覚は、数秒ごとに一方または他方を見るように交代し、時にはその間にまだらな闘争の期間があります。
私たちは後で本書で両眼視野闘争に何度か戻りますが、今のところ、それが知覚が純粋に刺激駆動型でボトムアップの特徴検出であるという考えに圧力をかけることに注意してください。闘争中、世界の物理的な刺激は同じままであるにもかかわらず、知覚は交代します。したがって、刺激自体が知覚を駆動するものではありません。ここで知覚システムに何らかの推論力を帰属させないことは非常に困難です。それはあたかも、知覚システムが、混乱した入力に対する合理的な解決策が、世界のどこかに顔と家の寄せ集めであるということを受け入れるのを拒否しているかのようです。
それをベイズ的俗語で言えば、私の知覚入力のそのような寄せ集め原因の事前確率は非常に低いということです。代わりに、非常に「修正主義的な」仮説が選択され、それぞれが入力される感覚信号の大部分を効果的に抑制します。それはあたかも、顔が見られるとき、視覚システムが「それはおそらく顔だろう、顔仮説が説明できない入力全体のすべての部分については気にするな」と言っているかのようです。そして、知覚が交代して家が見られるときも逆もまた然りです。この推論プロセスが正確にどのように進むかはさらなる問題ですが、何らかの推論に訴えることなしにこの効果を説明し始めることすら困難であることは明らかです。
ベイズ的で推論的な知覚へのアプローチは、やや知的主義的に見えるという懸念を思い出してください。これに対する最初の反応は、少なくとも、目の前のライバル入力のような特殊な状況では、ある程度の推論が必要であるように見えるということです。もちろん、脳がこの種の推論に頼らなければならないのは、主に非常に人工的な実験室の設定で遭遇する知覚状況の場合だけである可能性があります(それがどれほど珍しいかについては議論がありますが、Arnold 2011; O’Shea 2011 を参照)。脳が常に世界を知覚するために何らかの推論プロセスを使用し、ライバルリーは単に脳の日常的な推論プロセスをより見つけやすくする効果であるという仮定で作業するのが合理的だと思われます。
両眼視野闘争のいくつかの素晴らしい特別な側面は、脳がかなり洗練された推論作業に従事しているという仮定を強化します。1928年、エミリオ・ディアス=カネハ(Diaz-Caneja 1928)は、2つの画像を半分に切り、一方の目が例えば半分の家と半分の顔を、もう一方の目が家と顔の残りの半分を見るように組み合わせると、各目に提示されるものの間で闘争が起こるのではなく、代わりに顔と家の完全な、切断されていない画像の間に闘争が起こることを発見しました(図3は、ディアス=カネハが使用した種類の刺激でこれを示しています)。

これは脳による驚くべき偉業です。また、自分で体験するのも驚くべきことです。それは、たとえ闘争がある程度、各目からの処理の間の非常に低レベルの単なる競合の結果であるとしても、これが物語の全てではないことを示しています。なぜなら、画像半分が各目から取られ、一貫した、競い合う知覚へとグループ化されるからです。
同様に、指導的な神経科学者であるニコス・ロゴセティスの研究室での研究は、目に提示される画像が1秒に数回、目から目へと交換されても、闘争は比較的正常な形で続くことを示しています。したがって、もしあなたが現在、右目に示されている顔を見ているなら、右目の顔の画像が家の画像に交換されても、あなたは顔を見続けるでしょう(Logothetis, Leopold et al. 1996)。脳は、世界を理解するために、実際の入力を非常に劇的に覆します。
アンドレアス・ロープストルフとカール・フリストンと共に、私は両眼視野闘争でなぜ一度に一つの画像しか見えないのかについて、単純なベイズ的物語を提案しました。視覚システムは、例えば一方の目に家の画像、もう一方の目に顔の画像という形で、異常な総入力を受け取ります。この感覚入力の原因を説明するための関連する候補仮説は3つあります。それは家だけである、それは顔だけである、あるいはそれは顔と家の混合物である、というものです。システムは、(i) それらの尤度、つまり、家、顔、または顔と家の混合物がこの入力を引き起こした可能性がどのくらいか、そして (ii) それらの事前確率、つまり、実際の感覚入力に関係なく、今、家、顔、または顔と家を見る可能性がどのくらいか、に基づいてこれらの仮説の一つを選択します。ベイズ的物語は次のようになります。結合された顔と家の混合仮説は最も高い尤度を持ちます。なぜなら、それは顔または家の仮説単独よりも多くの感覚入力を説明するからです。しかし、この高い尤度は、顔と家が同じ時空間的位置に共存しうるという非常に低い確率を克服することはできません(時折、家の前に置かれた顔の透明な画像に出くわすかもしれませんが、完全に不透明な顔と家が空間の全く同じ位置にあることを想像するのは非常に困難です)。したがって、選択され、知覚を決定する仮説は、顔または家の仮説のいずれかです。図4(Hohwy, Roepstorff et al. 2008)。

この仮説に対するいくつかの経験的証拠が現れ始めています。もしベイズ的物語が正しければ、仮説の一つに対する事前確率が上がれば、その強化された仮説が闘争で優勢になるはずです。レイチェル・デニソンと同僚たち(Denison, Piazza et al. 2011)は、各目に異なる向きの線を使って闘争を誘発し、闘争が始まる直前に水平または垂直の位置で停止する回転する線を短時間見せることによって、一方または他方の目の刺激に有利な事前確率をうまくバイアスしました。予測通り、参加者は、最も高い事前確率を持つ刺激を最初の知覚として選択する可能性が高くなります。ジョウ・ウェンと同僚たち(Zhou, Jiang et al. 2010)は、参加者にテキストマーカーとバラの画像を提示することで両眼視野闘争を誘発しました。彼らは嗅覚的証拠を加え、参加者にバラの匂いを嗅がせることによって、それがバラである確率を上げました。ベイズ的物語によって予測された通り、参加者は結果的にバラの画像をより長く知覚しました。
後で見るように、この単純なベイズ的記述にはさらなる検討が必要です。一つには、両眼視野闘争でなぜ画像間の交代が続くのかを説明していません(第10章でこの問題に戻り、Hohwy et al. 2008で提示された提案をいくらか修正します)。これまで提示された限りでは、この記述は、なぜ一つの画像だけが知覚のために選択されるのかを説明するだけです。それでもなお、基本的なベイズ的考えは、少なくとも闘争のいくつかの本質的な特徴を理解し始めるのに役立ちます。
ベイズ的アプローチが両眼視野闘争および一般的な感覚処理の理解にどれだけ貢献できるかについては、まだ結論が出ていません(レビューについては、Blake and Wilson 2011を参照)。私は、闘争への訴えがこの議論をきっぱりと終わらせるとは示唆していませんが、それは、たとえ私たちの誰もが意識的にベイズの定理を知覚において知って適用していなくても、私たちの脳の知覚システムは無意識のうちに何らかの形でベイズの定理に従っていることを強く示唆しています。脳が私たちのために行うことは、確かに推論的です。私は、ヘルマン・フォン・ヘルムホルツやそれ以降の他の多くの人々が無意識の知覚的推論の概念を擁護するために多くの追加現象に訴えてきたにもかかわらず、両眼視野闘争が知覚的推論を擁護する上で特に良い事例を提供すると考えています。
ニューロンはどのようにしてベイズを知るのか?
提案は、脳が意識に知られることなく、洗練された確率的推論に従事しているというものです。これは、あたかも視覚野や脳全体の神経集団がベイズの定理を知って適用しているかのように聞こえるかもしれません。このように言うことは、私たちが神経擬人主義と呼ぶかもしれないもののリスクを伴います。つまり、脳に人間のような特性を不適切に帰属させ、それによって個人的レベルの説明と亜個人的レベルの説明を混同することです。見たように、知覚が脳によって実行される無意識の推論であると考える強い理由があるので、問題は、粗野な神経擬人主義に陥ることなく、この考えをどのように理解すべきかということです。
ここには巨大な理論的問題が埋もれており、それを完全に解決することはできません。しかし、私は脳が物事を「推論」し、「信じ」、「決定」するという言葉で話し続けるので、なぜこの用法が特に問題ではないと私が考えるのかを簡単に説明することが役立つかもしれません。うまくいけば、本書の残りの部分で、それは自然に思えるようになるでしょう。
この問題へのアナロジーは、コンピュータ科学と人工知能の研究から来ています。コンピュータチップの構成要素は、いかなる通常の意味でも、それらが実行しているプログラムの概念を「知って」いません。したがって、ソフトウェアが実際にハードウェアとどのように関係しているかについての理論的な議論があります。この種の議論は心の哲学でも行われており、心的状態に関する機能主義者は、心的状態が、特定の内部状態を考慮して、特定の種類の入力-出力プロファイルを指定する機能的役割によって定義されると主張します。簡単な例:もしあなたが身体的損傷の入力を持ち、叫んで火から手を引くという出力を持ち、身体的損傷を避けたいという欲求と手を動かすことが助けになるという信念の内部状態にあるならば、あなたは痛みの心的状態にあります。機能主義者は、この機能的役割と、その役割を果たす物理的なものとの関係について議論します。私たちの場合、それはしばしば痛みのマトリックスとラベル付けされる脳内の拡張されたネットワークです。
役割と役割を果たすものとの関係、そしてコンピュータプログラムとコンピュータチップとの関係には、「実装(implementation)」や「実現(realization)」といった様々な用語が使用され得ます(本書では「実現」を使う傾向があります)。これらの概念が正確に何を意味するかについては議論がありますが、私たちの目的のためには、この緩やかさは重要ではありません。また、機能主義が神経生物学的詳細からどの程度独立しているかについても議論があります。一部の機能主義者は、現象を理解するために重要なのはその実現ではなく機能的役割であると主張し、他の者は実現が重要であると主張します。さらに、計算論的アプローチが機能的役割や神経生物学的メカニズムとどのように関連するかについても議論があります(この議論を解決する素晴らしい議論については、Kaplan 2011 を参照)。本書で議論されるフレームワークの背後には重厚な機能的考察がありますが、脳の構造の神経生物学的詳細、すなわちその階層構造と脳内のメッセージパッシングの性質からも直接的な動機付けがあります。これは、次の章で見るように、予測誤差最小化で実装されたベイズ脳を強く示唆しています。
コンピュータ内部のハードウェアがプログラムで採用されている概念やルールを知らないからといって、コンピュータが計算に従事していないと主張する人はほとんどいないでしょう。同様に、脳を構成するニューロンがベイズの定理を知らないからといって、脳が確率的推論に従事していないと主張すべきではありません。むしろ私たちが主張すべきなのは、コンピュータがどのように計算に従事するかを理解するためには、ハードウェアがコンピュータプログラムで設定された機能的役割をどのように実現できるかを理解する必要があるということです。同様に、脳がどのように確率的推論に従事するかを理解するためには、ニューロンがベイズの定理の形式によって設定された機能的役割をどのように実現できるかを理解する必要があるのです。これを完全に理解することは些細な仕事ではありませんが、このように言うことで、ベイズ的アプローチが粗野な神経擬人主義であるという懸念はいくらか和らぎます。もしそうであったなら、コンピュータが計算するという主張も同様でしょう。
もちろん、これは脳へのベイズ的俗語の適用に関するかなり簡単な弁護です。その根底には、脳が情報処理に関与しているというかなり議論の余地のない考えと、情報理論がベイズの定理が導出される確率論の観点から鋳造されているという考えに基づいた、より実質的な見解があります(この導出に関する入門については、本章の最後のセクションを参照してください)。したがって、脳の処理が、ある記述レベルでベイズの定理をスムーズに関与させることができない方法で理解できるとしたら、それは奇妙でしょう。この種の感情は、クリス・エリアスミスが、私たちの心の概念が記号操作、コネクショニズム、ダイナミクスの比喩を超えて進む準備ができているという議論でよく捉えられています。「私たちは、心を、それが何であるか、すなわち、複雑な、物理的な、情報処理システム、すなわち脳のダイナミクスの結果として理解する立場にあると私は思います」(Eliasmith 2003: 494)。
多くの点で、この広範な思考の筋道が本書の推進力です。脳がベイズ的メカニズムであるという証拠が収束しています。この証拠は、私たちの知覚の概念、知覚と認知の経験的研究、計算理論、認識論、そしてますます神経解剖学と神経画像法から来ています。この証拠の発生の最良の説明は、脳がベイズ的メカニズムであるということです。したがって、最良の説明への推論によって、それはそうなのです。私は、最良の説明への推論への訴えが、この議論を切り抜ける方法として魅力的であると思います。なぜなら、この推論タイプ自体が本質的にベイズ的だからです。
推論から現象学へ
これまで、本章は無意識の確率的推論を知覚へのアプローチとして使用することを支持する事例を構築してきました。今こそ、そのようなやや簡素に見える推論が、どのようにして知覚経験の豊かさを構築できるかを考察する時です。
私は両眼視野闘争を、知覚における推論の概念の必要性を示すために用いました。闘争は、知覚の現象学についての議論を始めるためにも使用できます。闘争で起こることは、人が見るものが2つの画像の不変で混乱した寄せ集めであり、その人の概念的判断が交代するというわけではありません。つまり、顔と家の混合物を見て、「これは家だ…いや、顔だ…待て、いや、家だ…」と考えるわけではありません。闘争を非常に興味深いものにしているのは、変化するのが実際にあなたが見るものであり、つまり、推論プロセスが知覚内容自体を駆動するということです。
私自身の最初の闘争体験は、台所のテーブルで実験をしていた時でした。私は青と赤のおもちゃの車(ポルシェとバン)をテーブルに置き、それぞれをトイレットペーパーの芯を通して見ながら、目を自由融合させて車が視野の同じ位置に現れるように試みました。試行錯誤の末、それはうまくいき、息を呑みました。青い車の断片と赤い車の断片が見えるまだらな闘争の期間があり、あたかもそこにあるものについての3つの仮説(前の章で言及した、図4参照)が互いに戦っているかのようです。そして、青い斑点の一つが広がり始め、突然、私は青いポルシェだけを見ます。赤いバンは、それが私の片方の目に提示されていることをよく知っているにもかかわらず、何も残っていません。数秒後、バンの赤い角が現れ、広がり、青い車の痕跡をすべて抑制します。
闘争は、実際の視覚意識におけるこの非常に劇的な変化によって特徴づけられます。それはあたかも、脳が鮮やかな精神的な絵の具を使って、一方の目からの画像を塗りつぶしているかのようです。あなたが見るものは、「これは青いポルシェだ」と考えるような概念的な判断を引き起こすかもしれませんが、闘争で劇的に変化しているのは視覚知覚そのものです。ヘルムホルツの言葉を借りれば、闘争は「素晴らしい劇場」(”ein wunderliches Schauspiel”)です(Helmholtz 1867: 776)。私たちが確率的推論の観点から説明しようとしているのは、その知覚の現象学です。
すぐに、知覚的推論の概念は、その単純なベイズ的装いでは、対象を認識したり分類したりすることを可能にする単なるラベリング作業のように思えるかもしれません。青いポルシェを実際に見ることや、顔のすべての特徴といった豊かな知覚内容を生み出すプロセスとしてそれを捉えることはより困難です。見られるものに対するラベル間の競争しかないように思われます(「この入力を『青いポルシェ』、『赤いバン』、または『青赤のポルシェバン』として分類すべきか?」)。したがって、今の課題はこれです。知覚への推論的アプローチが、単なる概念的分類の違いだけでなく、知覚そのものの違いにも対応できることを示すことです。
これは重要な課題であり、本書のメッセージの中心です。先ほど行ったベイズ的な動きは、知覚そのものを説明するのではなく、知覚に関する概念的思考を説明することにしか興味がないのであれば、それで十分なように思えます。では、何がこれを特に知覚に関する説明にするのでしょうか?
この問いには答えがあります。これを見るためには、知覚の階層的な概念を理解する必要があります。ベイズ的知覚推論は、感覚属性のすべてのレベルに適用され、知覚は通常、これらのレベルの広い範囲を同時に取り込みます。これらの感覚処理のレベルは階層的に順序付けられており、これは仮説検証する脳の説明の重要な側面です。
具体的には、この知覚的推論の階層的な概念は、知覚経験に関する中心的な何かを捉えることができるように思われます。それは、知覚を単なる分類やラベリングから区別するものであり、すなわち、知覚は常に一人称視点からであるということです。私たちが車を見るだけでなく、それを私たちの視点から車として見るのです。目、頭、または体の動きが世界に対する私たちの視点を変えるにつれて、私たちの遠近法的経験の異なるレベルが協調して変化します。知覚内容は皮質の知覚階層に埋め込まれており、私たちの一人称視点が変化するにつれて、この内容に劇的な変化が生じることがあります。これは、私たちが物事がどうであるかについて言うこと、つまり、私たちが最終的にそれらをどのように分類するかは、遠近法的変化の間に物事が私たちにどのように一時的に見えるかに依存することを教えてくれます。私は今、知覚階層の概念を説明し、私たちの知覚の現象学のこれらの側面を捉えようと試みます。
因果的規則性の階層
世界は規則性に満ちています。昼は夜に続き、季節は互いに続き、ほとんどの権力は腐敗し、牛乳は酸っぱくなり、故障したブレーキはしばしば事故につながり、多くの結婚は離婚につながり、などです。これらの規則性は因果的な性質を持っています。故障したブレーキは事故を引き起こし、太陽系での惑星の自転は昼と夜の連続を引き起こし、多くの隠された原因が離婚に寄与することがあります。また、不規則性、あるいはノイズもあります。牛乳は酸っぱくなりますが、それが正確にいつ起こるかには多少のばらつきがあり、権力は腐敗しますが、どれくらい腐敗するかを言うのは難しいかもしれません。最良の状況下でさえ、私たちは還元不可能なノイズのレベルを受け入れなければなりません。知覚は、不規則性の中から規則性を、ノイズの中から信号を抽出することを私たちに要求します。科学では、これは通常、実験室で干渉要因を制御し、因果連鎖に賢明に介入することによって行われます。通常の知覚では、それは主に、関連する干渉要因を追跡し、モデル化することによって起こります(そして、第4章と第7章で議論するように、行動、注意、およびその他のトリックの助けを借りて)。
規則性は、数十ミリ秒から数百年、秒、分、そして数週間、数ヶ月、数年にわたって安定している規則性やルールに至るまで、さまざまな時間スケールで発生します。速い時間スケールの規則性には、手に持った物体を動かすと影がどのように変化するかといったものが含まれ、より遅いものには、捕まえようとしている風船の軌道に関するもの、さらに遅いものには、人々があなたの要求にどのように反応する傾向があるかに関するもの、そしてさらに遅いものには、金融不安の年に人々がどのように投票する傾向があるかに関するものが含まれます。
ほとんどの場合、時間スケールと詳細レベルの間にはトレードオフがあります。速く変化する規則性は詳細に適しています。より遅い規則性はより一般的で抽象的です。これは、規則性が私たちに何を予測させてくれるかを考えると意味が通ります。もし私が何かを大きな知覚的精度で予測したいなら、それを非常に遠い未来に行うことはできないので、速く変化する規則性に頼らなければなりません(出口調査は選挙の一週間前の世論調査よりも有権者の行動のより良い推定ですが、行動のための時間は少なくなります)。一方、より遠い未来への予測は、精度と、しばしば詳細の損失を伴います(私たちの現在の調子の曲線では、来週の日曜日のバイキングス戦に負けると予測するかもしれませんが、最終的なホイッスルの数秒前までには、正確にどれくらいの差で負けるかを予測できるだけでしょう)。詳細な行動のパターンに関する長期的な規則性があるかもしれないので、関係は複雑です。例えば、毎年9月にはメルボルンの新聞がオーストラリアン・ルールズ・フットボールに関する言葉でいっぱいになると予測できますが、それらの言葉が具体的に何であるかは正確にはわかりません。
規則性は、速いものから遅いものへと階層的に順序付けることができます。階層のレベルは、特定の遅い規則性、より高いレベルのものが、関連するより低いレベルの、より速い規則性に関係するように接続することができます(例えば、年間のニュースサイクル中のオーストラリアン・ルールズ・フットボールの単語頻度に関する遅い規則性は、私が最終的に読む単語に関するより速い規則性に関係します。もし私が遅い規則性を知っていれば、それらの単語の出現にそれほど驚きません)。このような完全な階層は、世界の因果構造と深さ、つまり、時空間スケールを越えて原因が相互作用し、入れ子になる方法を明らかにするでしょう。
因果構造と深さは、少なくとも3つの点で知覚にとって重要です。因果的相互作用は、私の感覚入力の原因と感覚入力自体の間に単純な一対一の関係を防ぐことによって、知覚的推論を困難にするものであり、本章の前半で議論しました。対象間の、そして知覚者と対象の間の因果的相互作用は、私たちの一人称の遠近法的経験を形成します(例えば、日光の下で対象をかざすと影が消えて対象の真の形が現れる様子)。最後に、因果構造は、私たちが知覚するものに基づいて、世界との私たち自身の因果的相互作用を計画することを可能にします。
脳は、この因果的、階層的構造の重要性に、非常に包括的な方法で応答します。脳の皮質階層に維持されているモデルにおいて、相互接続された階層を要約します。速い規則性は、感覚処理ストリームの初期段階で処理され(視覚知覚では、これは脳の後部にあるV1野で起こります)、その後、感覚信号が一次感覚野を通り抜け、より高次の領域へと進むにつれて、時間スケールが増加していきます。
階層には空間的な側面もあり、それは私たちがこれまで焦点を当ててきた時間的な側面と自然に適合します。階層の低レベル(V1など)で表される速い時間スケールの規則性は、わずか数度の小さく、詳細に焦点を当てた受容野を持つのに対し、後の処理領域はより広い受容野を持ちます(例:側頭皮質では20-50度)。受容野はまた、相互接続によって特徴づけられ、広い受容野は、階層の下の方で処理された小さな受容野のセットを取り込みます。
知覚的推論は、この高度に相互接続された皮質階層で起こり、それ自体が、世界を正しく理解しようとする試みにおいて、一人称視点を構築する際に、そして世界で行動するために自身を方向付ける能力において、無数の因果関係の表現を直接利用することができます(Friston 2008; Kiebel, Daunizeau et al. 2008)。私はまず、この知覚階層の特性のいくつかを探索し、次に、次の章で、それが脳でどのように生じ、どのように形成されるかを説明します。
知覚的な変動性と不変性
速い規則性は、経験の変動的な側面という形で知覚的推論に現れます。知覚は、私たちの即時的で絶えず変化する一人称視点を捉えます。例えば、目や頭が動いたり、知覚の対象が動き回ったりすることで一人称視点に違いが生じるたびに、脳は輪郭、陰影、向きといった非常に基本的な感覚属性について、速い因果的規則性を処理する必要があります。これらの変化の一部は抑制されます。例えば、目の素早いサッカード運動から生じるものなどです。しかし、多くの変化は意識的に経験されます。例えば、目の前の場面をスキャンするために頭を動かすことによって引き起こされるものなどです。
同時に、遅い規則性は知覚の不変な側面として現れます。知覚は、私たちの即時的で変動する一人称視点から抽象化し、世界が今、感覚によってどのようにサンプリングされているかという具体的な方法にあまり敏感でない世界の状況に焦点を当てる能力に依存しています。例えば、子供がバスケットボールの試合をしているのを知覚するとき、速い規則性には劇的な違いがあるにもかかわらず、あなたは急速に変化するごちゃごちゃした遠近法的シーンの連続ではなく、試合を通じて持続する対象を知覚します。不変な対象認識の印象的な計算モデルの設計者であるエドモンド・ロールズは、視覚知覚に関して次のように述べています。
大脳皮質の視覚系によって解決される主要な問題の一つは、大きさ、コントラスト、空間周波数、網膜上の位置、視野角、照明などに関係なく、対象と顔の認識が比較的独立して起こることを可能にする視覚情報の表現を構築することです。後頭側頭視覚皮質によって提供されるこれらの対象の不変な表現は、脳の他の多くのシステムの操作にとって非常に重要です。なぜなら、不変な表現があれば、対象の報酬/罰の関連、その対象がどこにあるか、そしてその対象が最近見られたかどうかについて一回の試行で学習し、そして同じ対象の他の視点などに正しく一般化することが可能になるからです。(Rolls 2012: 1)
変動的知覚と不変的知覚の違いは、ここで定義したように、程度の問題として考えるのが最もよく、終点はやや曖昧です。知覚がますます遅い規則性に依存するようになるにつれて、それはますます不変になります。例えば、人々を持続的な対象として知覚することは、人が私たちに微笑むときの顔の特徴の変化を知覚することよりも不変です。
変動的な端の時間スケールがどれくらい速いか、あるいは私たちが処理しても意識できる規則性が正確にどれくらい速いかは完全には明らかではありません(非常に基本的で速く変化する感覚属性、例えば線の向きや長さの特徴などがベイズ的に扱われるという計算論的証拠がいくつかあります、Rao and Ballard 1999参照)。また、不変的な端の規則性がどれくらい遅いかも明らかではありません。例として、最大限に遅い規則性は、全宇宙のビッグバン-ビッグクランチサイクルかもしれませんが、この規則性は、私たちが様々な方法でそれを表現できるとしても、進行中の知覚的推論を調整する役割を果たすことは非常にありそうにありません。一方、光は通常上から来るというかなり一定の規則性は、凸面性と凹面性の知覚的推論に影響を与えます(これに関する実験については、Adams, Graf et al. 2004; Morgenstern, Murray et al. 2011参照)。同様に、私たちが年をとるにつれて私たちの体がどのように成長し変化するかを捉える遅い規則性は、時間を経て他の人々を知覚することに考慮され、長い不在の後に彼らを見たときの私たちの驚きのレベルを調整するかもしれません。例えば、私は年をとらないように見える人々に驚きます。
したがって、知覚における不変性の度合いを、表現された因果的規則性の時空間的階層の観点から考えることが可能です。これは、あなたの一人称視点の素晴らしい概念を生み出します。すなわち、あなたの実際の知覚的推論が不変性に従って順序付けられ、接続されたものとしてです。あなたの一人称視点と私の一人称視点は、私たちが異なる短時間スケールの、変動的な推論に従事する限りにおいて異なり、私たちがより広範な時間スケールにわたって類似の推論に従事する限りにおいて重なります。
これは、知覚経験の重要な特徴、すなわちそれが常に一人称視点を持つということを説明するのに役立ち、したがって、ベイズ的知覚推論の概念が、単なる対象の分類ではなく、知覚にどのように関わるかを理解するのに役立ちます。もしベイズ的知覚推論が、広い時空間的範囲にわたる因果階層の要約の中で起こるならば、それは認識と計画にとって重要な不変的知覚と、より一時的な一人称視点に特徴的な変動性の両方を含むことができます。
したがって、因果階層は、知覚的推論の妥当な説明にとって極めて重要です。それは、変動的(一人称遠近法的)知覚と不変的知覚を一つのタイプのプロセス内で組み合わせるための第一歩を提供します。この側面は、次に、世界の事態を知る私たちの能力と、私たち自身がその中にどのように位置づけられているかに関する、より認識論的な問題に関連します。時々、私たちは、私たちの知覚的推論が、私たちの変動的な視点にあまりにも依存していることを学ぶため、それが正しいかどうかを疑うようになります。それは、私たちを現実検証へと導き、ある事態をより良く、より深く、異なる視点から探求することにつながるかもしれません。そのような場合の現実検証の目的は、不変的知覚によりしっかりと根ざした、より確信のある知覚的推論に到達することです。同様に、世界の事態に関する私たちの知覚的知識は、世界を通る私たち自身の個人的な軌道に依存しており、これは変動的知覚が私たちに情報を提供するものです。変動的な情報の流れは、私たちが世界の対象に対してどのように位置づけられているかを追跡することを可能にします。したがって、知覚階層は、私たち自身の認識論的役割をどのように考えるかについても役割を果たします。これらの認識論的な事柄は、知覚の現象学のより深い側面に関わり、それらもまた知覚階層に関連するように思われます。私はこれらの問題のいくつかを第7章でより詳細に追求します。
階層レベル間のメッセージパッシング
知覚的推論の階層に関する基本的な考えは、階層の各レベルで、私たちは世界の因果構造をより深く探求するということです。しかし、構造は、単に増大し続ける時間スケールのレベルを積み重ねることだけの問題ではありません。因果構造の重要な要素は、異なる時間スケールでの規則性間の相互作用に関係しています。この相互作用はボトムアップ方式で機能し、例えば、輪郭、向きなどを支配する速く変化する規則性は、あなたが見ているものが本当に持続的な顔に属する鼻であることをより確信するのに役立ちます。また、それはトップダウン方式でも機能し、顔を支配するより長期的な規則性(例:それらは頭のある体に取り付けられている傾向がある)は、顔からの入力の速いスケールの変化(例えば、体が動くときの鼻によって投げかけられる影)を回復するのを助けます。そのような相互作用が存在するためには、階層の異なるレベルを上下に広範囲にわたるメッセージの伝達がなければなりません。これらのメッセージを理解することは、知覚的推論がどのように機能するかを理解するために不可欠です(Lee and Mumford 2003)。
ベイズ物語の発展形を用いて、フリストンと彼の同僚たち(Friston and Kiebel 2009)は、レベル間のメッセージパッシングを例示する計算モデルを提供しています。別の鳥の歌を聞いている鳥は、歌の速い時間スケールの変調を抽出し、それを使って時間をかけて、他の鳥の大きさと強さに関するより遅い時間スケールの規則性を抽出することができます。おそらく、より強い鳥はよりはっきりと、より力強く、より長く歌います。しかし逆に、歌っている鳥の大きさと強さについて仮定がなされれば、それは歌の速いスケールのダイナミクスのニュアンスを抽出するのに役立ち、それはそうでなければノイズの中で失われてしまうかもしれません。低レベルの、速いスケールの規則性は、より高いレベルでの仮説の中から選択するのを助け、より遅い規則性に関するより高いレベルの仮説は、低レベルの規則性に対する制御パラメータとして機能します。
このタイプのトップダウンおよびボトムアップのメッセージパッシングは、知覚階層のレベルを結びつけます。視覚または聴覚の知覚の現象学自体が、単に因果的に浅い感覚であり、それを後で徐々に深い因果構造のカテゴリーでラベル付けできるというわけではありません。これは、各レベルでの処理がある意味で完了し、メッセージパッシングが完全に処理された製品を次のレベルに分類のために送るだけの問題である場合に期待されるような描像です。描像は、代わりに、下位レベルの活動に対する強いトップダウン変調を伴う、はるかに相互作用的なものです。つまり、変動的知覚自体が因果構造に浸透しているのです。私たちは、変化する光と影の知覚を、それがどの対象であるかの知覚から完全に切り離すことは難しいと感じ、知覚階層を通じたメッセージパッシングはこれを反映しています。
したがって、知覚階層のレベルがどのように接続されるかというこの描像は、レベル間の広範なメッセージパッシングに依存しています。より遅い時間スケールの規則性を考慮したトップダウンの期待があり、より速い時間スケールの処理は、何らかの形で、より高いレベルのプロセスを導くことができるボトムアップ方式でメッセージを送ります。図5は、この最初の考えのスキーマを提供します。次の章では、より洗練されたバージョンが、入力と期待の出会いで何が起こるか、事前期待がどこから来るか、そして次に何が起こるかを説明します。

図5. 知覚階層、初版。異なる時間スケールでの因果的規則性の処理は、ボトムアップ-トップダウン方式で互いに影響し合う。感覚入力(上向きの濃い灰色の矢印)は事前期待(下向きの黒い矢印)と出会い、知覚的推論は階層の複数の層で同時に決定され、世界の構造化された表現を構築する。この図は、もちろん脳には3つの明確に定義された階層レベルしかないわけではないので、大幅に簡略化されている。この図の後のバージョンでは、レベル間のメッセージパッシングの記述がニュアンス付けされるだろう。特に、濃い灰色の矢印は「予測誤差」として再ラベル付けされる。
この同時並行的なメッセージパッシングの忙しいパターンは、次の章で明らかになる仮説検証メカニズムの中心であり、そのとき初めて知覚階層の力が本当に評価されうるのです。
階層的推論への追加的制約
知覚階層の概念に照らして、私たちは今、知覚的推論に対する追加の制約の必要性に関する問題に再び立ち返ることができます。感覚入力の原因に関する異なる仮説の間で優先順位を付けるために、システムは事前信念に訴える必要があります。しかし、事前信念は単なる当てずっぽうよりは優れていなければならず、もしその話が事前信念が私たちが理解しようとしているまさにそのもの、すなわち知覚的推論に直接基づいていることに帰着するならば、私たちの説明は循環的になります。つまり、問題は、循環することなく事前信念を説明することでした。知覚階層における相互のメッセージパッシングによって、私たちはまだ問題を解決することなく、事前信念を位置づけるために何かをすることができます。
一部の事前信念は、より高いレベルから伝達される期待に具体化されています。再び鳥の歌の例を使うと、鳥が強い歌手から鳥の歌が来ると期待する場合、階層の下の方のより速い時間スケールでの個々の音符の抽出のための推論は、それらのより長期的な期待によって導かれることができます。したがって、事前期待は、階層のより高いレベルで最もよく学習されたものから引き出されます(これは経験的ベイズと呼ばれます。簡単な紹介については、Bishop 2007: Ch. 3.5 を参照)。これは、非常に高いレベルの期待が、中間レベルを通してフィルタリングされながら、下の多くのレベルを形成するのを助けるカスケード方式で起こり得ます。これは、必要な追加の制約が感覚信号から直接抽出されるのではなく、それが脅威となる循環や、プロセスをブートストラップしようとする絶望的な試みにつながるものではないことを意味します。
ヘルムホルツは、この場合の例として、私たちの視野の異なる部分における深さと色の学習された長期的な視覚的期待という興味深い事前情報について言及しています。彼は、空の雲は地面の物体よりも奥行きの遠近感が少なく、地面の物体の色は、近くにあるか遠くにあるかによって変化して見えると観察しています。彼は、両脚の間に頭を突っ込むことでこれをテストしたようです。
頭を逆さまにすると、雲は本当の深さを得るように見え、一方、地面の物体は、[通常見える]空の雲のように、垂直な面に描かれた絵のように見える。この場合、色もまた近くと遠くの物体との関係を失い、元の違いをもって私たちに現れる。(ヘルムホルツ 1867: 432)
つまり、雲が視野の下半分に現れると、それらはすぐにより知覚される深さを獲得し、通常は地面にある物体が視野の上半分に現れると、それらは深さを失い、また、深さの手がかりによって決定される色の変調も失います。多くの人が、雲の上を飛んでいるときにこの種の効果を経験し、この視点から見たときにそれらが獲得するように見える異常な深さと美しさに気づくでしょう。視野の下半分における深さに対する長期的な期待は、そこに置かれた物体から情報を抽出することを可能にし、上半分のこの期待の欠如は、そこに置かれた馴染みのある物体でさえ、深さ情報を抽出する私たちの能力を制限します。
この階層的で入れ子になった推論の考えは、知覚的推論に必要な追加の制約を説明するための第一歩を提供します。「事前確率はどこから来るのか?」という問いが生じたときに、ベイズの議論における標準的な動きのバージョンです(Kersten, Mamassian et al. 2004; Friston 2005)。もし事前確率が完全に主観的に設定されるなら、それはあまり満足のいくものではありませんし、もし完全に主観的に設定されないなら、それらを提供するためにベイズのフレームワークを超えなければならないように思われます。階層と経験的ベイズの概念があれば、私たちは単にそれらがより高いレベルから抽出されると言うことができます。しかし、明らかに、これは説明の第一歩にすぎません。第二歩は、これらのトップダウンの事前確率がどのようにして到達され、時間をかけてどのように形成されるかに関わる必要があります。その説明のステップは、より高い階層レベルに埋め込まれた事前知識が、単なる当てずっぽうに委ねられていないことを示さなければなりません。次の章で見るように、その説明は、事前確率自体が、入力される感覚信号の処理から生じる特定の種類のフィードバック信号によって導かれるというものです。すると、きれいな説明の円環が現れるように思われます。トップダウンの事前確率が知覚的推論を導き、知覚的推論が事前確率を形成する。このような単純な言葉で述べると、この円環は明らかに知覚的推論を支えるのに適していません。メッセージは完全に無駄に回され、決して世界の知覚には至らない可能性があります。トリックは、2つのステップが連続して実行されると考えることです(それは円環というよりは、いわば螺旋です)、そして物語全体に特定の、予測的な風味を与えることです。これが、次の章で議論する重要な予測誤差最小化メカニズムの仕事であり、事前確率がどこから来るのかを説明するものです。
ベイズの定理について
ベイズの定理は確率論の単純な結果であると同時に、非常に強力な考えです。まず、この単純な結果がどのようにして生じるかを見て、次に、なぜそれが合理性と科学的探究の模範として採用されるのかを見ることが役立つかもしれません。このセクションでは、後の章で使用される非常に最小限の形式的表記法を設定します。
2つの確率変数DとCが特定の値dとcをとる同時確率に興味があるとしましょう。例として、今年は干ばつが終わる確率と、今年は私のコンピュータが故障する確率がどのくらいかを知りたいとします。この同時確率を次のように書くことができます。
P(d, c)
この式を変換する一つの方法は次のようです。
P(d,c)=P(d|c)P(c)
これは直感的に意味が通ります。なぜなら、これは単に、両方の事象が起こる確率は、一方の事象が他方の事象が起こった場合に起こる確率に、その他方の事象が起こる確率を掛けたものと同じであると言っているからです。干ばつが終わり、私のコンピュータが壊れる確率は、私のコンピュータが壊れる年に干ばつが終わる確率がどのくらいかを見つけ、その確率をそもそも私のコンピュータが壊れる確率で調整すれば見つかります。これは確率を連鎖させる方法です。
この種の式で確率を連鎖させる順序は問題ではありません。つまり、干ばつが終わる年に私のコンピュータが壊れる確率がどのくらいかを問い、その条件付き確率をそもそも干ばつが終わる確率で調整することも同様にできます。したがって、次のように言うことができます。
P(d, c)=P(c|d)P(d)
しかし今、これらの式の2つの右辺を組み合わせることができます。なぜなら、それらは両方ともP(d, c)に等しいからです。したがって、
P(d|c)P(c)=P(c|d)P(d).
両辺をP(c)で割るのは簡単です。
P(d|c)P(c)/P(c)=P(c|d)P(d)/P(c),
そして左辺を整理すると
P(d|c)=P(c|d)P(d)/P(c),
これは他ならぬベイズの定理そのものです。私たちの例では、コンピュータが壊れた場合に干ばつが終わる確率は、干ばつが終わった場合にコンピュータが壊れる確率に、そもそも干ばつが終わる確率を掛け、そしてそれをそもそもコンピュータが壊れる確率で割ったものに等しいと言っています。
このルールは単なる確率論の結果として留まっていたかもしれませんが、ベイズ、ラプラス、その他は、新しい証拠に照らして信念をどのように更新すべきかを考える試みにおいて、それに焦点を当てました。次のステップは、なぜこの単純な結果がこれらの目的のために採用されるべきかを理解することです。モデルと仮説を区別します。モデルは、いくつかの競合する、または代替的な仮説を持つことができるという意味でです。例えば、私は結果をコイン投げまたはサイコロ投げの観点からモデル化することができます。コインとサイコロは観察された結果のモデルに対応します。各モデルにはいくつかの仮説があります。例えば、コインモデルの下で私の観察を説明する最良の仮説は、コインが裏であったというものです。本書全体を通して、私たちは主に、問題の主体によって仮定されたモデルmの下での仮説hを扱います。現在の目的のために、モデルは脇に置き、仮説に焦点を当てます。
したがって、ベイズの定理の適用のためには、2つのこと、仮説hと、いくつかの証拠eを考慮したいと思います。仮説は証拠によってどれくらい強く支持されるでしょうか?直感的には、それは2つのことに依存します。第一に、証拠が仮説にどれだけ密接に適合するか、そして第二に、そもそも仮説がどれほど確からしいかです。これらの2つの要素は、たとえ私たちがしばしば実際の計算を試みるときに間違えるとしても、そのような事柄について私たちが批判的に考える方法を反映しています。
9/11の世界貿易センター攻撃に関する陰謀論に直面したとしましょう。大規模で、秘密の、国家主導の陰謀という仮説は、証拠を信じられないほどよく説明します。本当にそのような陰謀があったとすれば、私たちが爆破や他の多くの関連証拠を観察した可能性は非常に高いです。つまり、陰謀仮説を条件とした場合の証拠の確率、P(e|h)は高いです。これがおそらく、一部の人々がこの種の陰謀論を考え始める理由です。
しかし、次に私たちは、この特定の証拠を考慮せずに、そもそもそのような陰謀が存在する確率がどのくらいかをすぐに考えます。もちろん、この確率P(h)は、絶対に微々たるものです。ですから、私たちは、陰謀仮説が確かに多くのこと、競合する仮説が説明できない証拠の断片を含めて説明するであろうにもかかわらず、それはそもそも非常にありそうにないので、それを信じるべきではないと言います。しかし、これは単にベイズの定理を実行する方法です。私たちは(高い)仮説を条件とした場合の証拠の尤度を、(微々たる)事前確率で掛け合わせます。私たちが興味があるのは、手元にある証拠e(すなわち、攻撃など)を考慮して、陰謀論hを信じるべきかどうか、つまり、「P(h|e)?」と問い、そして「P(e|h)P(h)」と答えることです。
目次
序文
序論
本書の議論
本書の構成
背景
本書について
第I部 メカニズム
1 因果推論としての知覚
知覚的推論への制約
知覚とベイズの定理
知覚的推論と両眼視野闘争
ニューロンはどのようにしてベイズを知るのか?
推論から現象学へ
因果的規則性の階層
知覚的な変動性と不変性
階層レベル間のメッセージパッシング
階層的推論への追加的制約
ベイズの定理について
要約:階層的な神経推論メカニズム
注
2 予測誤差最小化
統計的な例示
世界との関係の再概念化
世界に監督されること
より深い視点
認識とモデル反転
要約:予測における知覚
注
3 予測誤差、文脈、そして精度
文脈と不確実性
漏れるダムを塞ぐ
期待精度
精度と予測誤差ゲイン
基本的なメカニズム:生じる問題
要約:受動的な知覚者か?
注
4 行動と期待される経験
知覚における能動的推論
エージェントのモデル化と行動
驚きの抑制
能動的推論:生じる問題
予測誤差最小化:課題
要約:心を理解するための準備
注
第II部 世界
5 結合は推論である
結合問題と因果推論
ベイズ物語への最初の訴え
共通原因から感覚的結合へ
結合、注意、そして精度
要約:誤差最小化における結合
注
6 予測することは見ることか?
認知的浸透性:最初の動き
増大する不確実性の下での認知的浸透性
認知的非浸透性のための余地
認知的浸透性のありうる事例
要約:認知的浸透性のバランスのとれた概念
注
7 不安定な予測
知覚と誤知覚のトレードオフ
正確さとノイズ
精度、サンプリング、そして事前信念
現実検証
知覚の法廷
精神疾患と予測誤差
妄想と期待精度
自閉症と期待精度
受動的推論と能動的推論のバランス
要約:病と健康における予測誤差の失敗
注
8 驚きと誤表象
予測誤差最小化の失敗としての誤知覚
誤知覚と規則遵循
階層的な提示様式
ベイズの部屋にて
要約:表象のためのメカニズム
注
第III部 心
9 精度、注意、そして意識
心的サーチライトから精度期待へ
ノイズと不確実性のパターンの学習
注意における期待精度のパターン
能動的推論としての意図的注意
低ゲインと事前確率としての不注意による盲
内因性注意と外因性注意
注意と意識的知覚
要約:注意と意識の統計的側面
注
10 行動における知覚的統一性
因果推論から意識へ?
知覚的統一性
統一性、そしてグローバル・ニューロナル・ワークスペースの発火
発火、能動的推論、そして統一性
行動に基づく統一性と間接性
要約:統一性と因果的隔離
注
11 自然の脆弱な鏡
真理の追跡者か、それとも単なる誤差最小化への嗜好か?
知覚は間接的か?
ベイズ的な身体
脆弱性、内在性、そして状況性
要約:当惑させる、そして慰めとなる知覚的関係か?
注
12 予測する心の中へ
感情と身体感覚
内省は心的原因に関する推論である
相互作用における私的な心
感覚的軌跡としての自己
要約:確率的で因果的な心
注
結びの言葉:予測における心
謝辞
参考文献
索引