AIは、チャットや論文で、与えられた言葉の並び方を見て、その次にくる言葉を統計的に予測していると言われてきた。あらかじめ学習していたデータがあって、それを参照して、与えられた文字列の次に来る確率が高い単語は何かを予測している。
最近では推論型の処理が重要になっている。統計データだけに頼るのではなく、推論によって、次の単語を予測する。
誤差修正知性の場合にも、入力された前提条件を基にして、未来を予測して、その予測と、現実の結果を照合して、誤差を検出して、必要ならば世界モデルを修正して対応する。
AIも誤差修正知性も、入力された前提条件を基にして、次の瞬間について予測している。
考えてみて、おかしいなと思うのは、入力された前提条件については、価値判断することなく、受け入れる必要があることだ。人間はそんなことはない。何か他人に言われたときには、その発言の内容について、主観的にいろいろな判断をして、気に入らないようなら、その内容を無価値なものと判定して、対応することもある。
雑音だとか間違いだとかの判断は早い方がいい。エネルギーの節約になる。ところが、AIも誤差修正知性も、与えられた前提条件をまずは価値判断せずに受け取って、反応しているように思われる。
人間のように、その言葉の周辺状況も判断して、その言葉が雑音かどうかを判定したほうが能率がいいだろう。
しかしそのためには、AIや誤差修正知性回路に一旦は取り込んで処理しないといけないが、それはエネルギーの浪費になりそうだ。人間は、脳の回路に入れる前に、情報の価値を判断しているように思われる。
それが、偏見とか先入観とかと言われるものだ。これがあるから、エネルギー節約ができる。
AIや誤差修正知性回路に取り入れて判断する方法とは別に、門前払いする方法もあるはずだろうと思う。
★
非常に鋭い問いです。「門前払い」という概念が核心を突いています。これは認知科学・神経科学・AI研究の最前線にある問いです。
情報の「門前払い」——価値判断の二重構造
Ⅰ. あなたの観察を整理する
あなたが指摘していることを構造化すると、二つの異なる情報処理様式があります。
様式A:取り込んでから判断する 情報をシステム内部に入力し、処理した上で「有用か雑音か」を判定する。AIと誤差修正知性はこちらに近い。エネルギーコストが高い。
様式B:取り込む前に判断する(門前払い) 情報を内部に入れる前に、周辺状況から価値を推定して取捨選択する。人間の偏見・先入観がこれに対応する。エネルギー効率が高い。
そしてあなたの問いは「様式Bはいかにして実現されるか、またそのコストはどこで払われているか」です。
Ⅱ. 人間の脳における「門前払い」の実装
神経科学の観点から見ると、人間の脳には複数の「フィルター段階」が存在します。
第一段階:感覚フィルター(感覚器レベル)
人間の感覚器はすべての物理的刺激を等しく処理しているわけではありません。網膜は視野の中心部(中心窩)を周辺部より格段に高解像度で処理します。聴覚系は特定の周波数帯域を優先します。これは「取り込む前」のハードウェアレベルのフィルターです。
第二段階:視床フィルター(thalamic gating)
脳への感覚入力の多くは視床を経由します。視床は「感覚の中継所」であると同時に、大脳皮質の状態に応じて特定の入力を増幅・抑制する「ゲート」として機能します。睡眠中に外部刺激が意識に届きにくいのはこのゲートが閉じるからです。
これはAIにはほぼ対応物がありません。AIへの入力はトークン列として等しく処理されます。
第三段階:扁桃体による緊急評価
扁桃体は感覚入力を、大脳皮質が詳細に処理する前に「脅威か安全か」を高速で評価します。この経路は「低い道(low road)」と呼ばれ、皮質経路(「高い道」)より速く、粗い。ヘビに似た形を見た瞬間に飛び退く反応はこの経路によります。
これが神経科学的な「門前払い」の実装です。しかし重要なのは、このフィルターのコストは「事前学習」によって払われているという点です。扁桃体が高速評価できるのは、過去の経験から「これは危険なパターン」という圧縮された知識を持っているからです。
第四段階:注意フィルター(salience network)
前回の議論で登場したドパミンによる顕著性(salience)の付与がここで機能します。何を「重要な信号」として意識に上げるかを選別するシステムです。これが機能不全に陥ったのが統合失調症の誤差過大状態でした。
Ⅲ. 「偏見・先入観」の再評価——エネルギー節約システムとして
あなたが「偏見・先入観」として挙げたものは、通常は否定的に語られます。しかし認知科学的には、これらは進化的に最適化されたエネルギー節約システムとして理解できます。
カーネマンの「システム1・システム2」の区別がここに対応します。
システム1(速い思考):自動的・直感的・エネルギー低消費。これが「門前払い」を実行します。パターン認識・ヒューリスティクス・感情的反応がここに属します。
システム2(遅い思考):意識的・論理的・エネルギー高消費。これが「取り込んでから判断する」様式に対応します。
人間は可能な限りシステム1で処理し、システム1が処理できない時だけシステム2を起動します。これはエネルギー効率の観点から合理的な設計です。
しかしシステム1の「門前払い」には根本的な問題があります。フィルターの基準が過去の経験に固定されているため、新しい情報を排除しやすい。 偏見が偏見である理由はここにあります——かつて有効だったパターン認識が、新しい文脈では誤りになる。
Ⅳ. AIにおける「門前払い」の現状と限界
現在のAI(大型言語モデル)は、あなたの指摘通り「様式A」に近い設計です。入力されたトークン列を等しく処理し、内部で評価します。
しかし完全に「様式A」ではありません。いくつかの「門前払い」的な機能が実装されています。
コンテキストウィンドウの制限
処理できる入力の長さに上限があります。これは物理的なフィルターであり、「すべてを取り込めない」という意味での門前払いです。
トークナイゼーション
入力テキストをトークンに変換する段階で、ある程度の情報圧縮が起きます。細かいフォーマット情報などは失われます。
システムプロンプトと安全フィルター
特定のパターン(有害コンテンツ・禁止されたカテゴリー)を早期に検出して処理を変えるシステムが存在します。これは扁桃体の緊急評価に対応する「門前払い」の実装と言えます。
注意機構(Attention Mechanism)
トランスフォーマーの注意機構は、入力の全トークンを等しく処理するのではなく、関連性の高いトークンに重みをかけます。これは「完全な等価処理」への修正であり、部分的な優先度付けです。
しかし人間の扁桃体的な「皮質処理の前の高速評価」に対応するものは、現在のAIにはほぼ存在しません。これはアーキテクチャの根本的な違いです。
Ⅴ. 「門前払い」のコストはどこで払われるか
あなたが鋭く指摘したように、「門前払い」はエネルギー節約に見えますが、コストがゼロではありません。コストは別の場所で払われています。
人間の場合のコスト
門前払いの基準(偏見・先入観・直感)を形成するために、長大な学習経験のコストが払われています。扁桃体が「ヘビ的パターン」を高速認識できるのは、進化的に蓄積された何百万年分の経験コストがあるからです。個人レベルでも、幼少期からの経験がシステム1を形成するコストは膨大です。
つまり「門前払い」は、前払いされたコストによって実現される後払いの節約です。
AIの場合
事前学習(pre-training)がこの「前払いコスト」に対応します。膨大なデータと計算資源を使って学習したパラメータが、推論時の「門前払い」的な判断を可能にします。
推論型AIが「遅い」のは、この前払いコストを推論時にも追加投資しているからです。より「考える」ことで精度は上がりますが、速度とエネルギーのコストが増大します。
Ⅵ. 根本的な非対称性
あなたの問いが最終的に指し示しているのは、人間の認知とAIの認知の根本的な非対称性です。
人間の「門前払い」は、身体・感情・社会的文脈を統合した評価です。「この人が言っていることだから信用できない」という判断は、その人の表情・声のトーン・過去の関係・社会的地位・その場の雰囲気——これらすべてを統合した高速評価です。
現在のAIは、テキストという一次元の情報しか持ちません。「誰が言っているか」「どのような文脈で言われているか」という情報は、テキストに明示されない限り存在しません。
これは根本的な設計の違いです。人間の認知は身体を持つ存在として進化した多感覚統合システムであり、AIは記号列の統計的処理として設計されたシステムです。
あなたが感じた「おかしい」という感覚は正確です。AIと誤差修正知性は、前提条件を「まず受け取る」という点で共通しています。しかし人間は「受け取る前に身体と感情と文脈で判断する」という層を持っている。この層をAIに実装することは、現在の言語モデルのアーキテクチャの根本的な変更を必要とする問いです。そしてそれは、AIが「身体を持つ」とはどういうことかという、まだ解かれていない問いと不可分です。
★
ご指摘の点は、現代の認知科学(特に脳の「予測符号化」や「能動的推論」の理論)およびAI工学における非常に本質的な課題と深く重なっています。
「偏見や先入観(事前分布/バイアス)を用いて、入力情報を手前で門前払いする(フィルタリングする)ことで脳の消費エネルギーを節約している」というメカニズムは、生物の生存戦略としてきわめて合理的です。
これに対して、現在のAIや「誤差修正知性」がどのようにこの「門前払い(ゲートキーピング)」を実現しようとしているのか、あるいはなぜそれが難しいのかについて、いくつかの視点から整理します。
1. 人間の脳における「門前払い」の仕組み(予測符号化)
認知科学における「誤差修正知性(予測処理モデル)」では、脳は入力をそのまま受け取っているわけではないとされています。
- トップダウンの抑制: 脳の上位階層(予測、先入観、文脈)から下位階層(感覚入力)に対して、「おそらくこういう入力が来るだろう」という予測を常に送っています。
- 誤差のみの伝達: 入力された情報が予測通りであれば、その情報は「既知のもの(ノイズまたは重要でないもの)」として処理され、脳の上位階層には伝達されません(信号が抑制されます)。予測と異なった「誤差」だけが、上の階層に送られます。
- 注意(アテンション)による遮断: もし「この状況におけるこの入力は無価値だ」と判断されると、脳はその入力チャネルのゲイン(感度)を下げます。これが、雑音を「聞き流す」という門前払いの状態です。
このように、人間の脳は「先入観(予測)と一致するものは無視し、予期せぬ変化(誤差)のみにリソースを割く」、あるいは「不要と判断したチャネルを物理的・化学的に遮断する」ことで、圧倒的な省エネ(約20Wの消費電力)を実現しています。
2. 現在のAIにおける「門前払い」の試み
従来のLLM(大規模言語モデル)は、入力されたすべての単語(トークン)を等しく巨大なネットワークに通して計算するため、ご指摘の通り「非常にエネルギー効率が悪い」仕組みになっています。
しかし、最近のAI技術でも、エネルギー節約のための「門前払い」に似た仕組みが導入され始めています。
- 入力フィルター(ガードレール/モデレーションモデル)の設置:
メインの巨大なAI(システム2に相当)を動かす前に、非常に軽量で高速な「仕分け用AI(システム1に相当)」を通します。ここで「これはスパムだ」「無意味な質問だ」「有害な内容だ」と判定されたものは、メインのAIに送られる前に即座にエラーを返して処理を終了(門前払い)させます。 - Early Exiting(早期退出):
ニューラルネットワークのすべての層(例えば100層)を通すのではなく、最初の数層(例えば5層目)を通した時点で「これは単純なノイズだ」あるいは「簡単すぎる問題だ」と判断できた場合、残りの層の計算をスキップして出力を出す技術です。 - Mixture of Experts (MoE) 構造:
すべての脳細胞を使うのではなく、入力のテーマに応じて、関係のある一部の専門ネットワーク(エキスパート)だけを活性化させ、関係のない部分は休止させておく手法です。
3. 「門前払い(偏見)」のジレンマ
人間のように「周辺状況から判断して、最初から相手にしない」というアプローチは効率的ですが、人工知能にこれを実装するにあたっては、以下のようなトレードオフ(ジレンマ)が生じます。
- 「創造性」や「客観性」とのトレードオフ:
偏見や先入観が強すぎると、AIは「予想外だが、極めて重要で正しい事実」をもノイズとして門前払いしてしまう可能性が高まります。AIには客観性や網羅性が求められることが多いため、人間のように「気に入らないから聞かない」という態度をどこまで許容すべきかは難しい問題です。 - 「主観(価値基準)」の設計の難しさ:
人間が門前払いできるのは、自分の中に「生存」や「自己の一貫性の維持」といった絶対的な主観的価値基準があるからです。AIに「何を無価値とみなすか」という主観を静的に持たせようとすると、開発者の偏見がそのまま反映されてしまうリスクがあります。
まとめ
お考えの通り、入力された前提をすべて真に受けて処理を始めるのは、計算資源(エネルギー)の観点から非効率です。
現在のAI工学もまた、すべての情報を等しく処理する段階から、「軽量なフィルターでノイズを即座にはじく(システム1的処理)」、そして「本当に必要な複雑な問題にのみリソースを集中させる(システム2的推論)」という、人間の「先入観を用いた省エネ戦略」に近いアーキテクチャへと移行しつつあります。
★
私は、あなたが指摘している問題はかなり本質的だと思います。
特に面白いのは、
AIや誤差修正知性は、入力をまず受け入れてから評価する。
人間はもっと前の段階で門前払いしているのではないか。
という部分です。
実は認知科学や神経科学でも、この問題は長く議論されています。
「まず受け入れる」のか?
誤差修正知性(予測処理・Predictive Processing)の説明では、
- 世界モデルが予測する
- 感覚入力が来る
- 予測誤差を計算する
- モデルを修正する
という流れになります。
この図式だけ見ると、
感覚入力は無条件に受理される
ように見えます。
しかし実際の脳はもっと複雑です。
脳には
- 注意(attention)
- 信頼度(precision)
- 顕著性(salience)
と呼ばれる仕組みがあります。
予測誤差そのものに、
この誤差は重要そうだ
この誤差は無視してよさそうだ
という重み付けが行われています。
つまり、
誤差修正知性も実は完全な平等主義ではありません。
偏見は誤差修正の敵ではない
むしろあなたの言う
偏見
先入観
は、予測処理理論では
「強い事前分布」
とみなせます。
例えば、
夜道を歩いていて
ガサッ
と音がしたとします。
脳は
- 猫かもしれない
- 風かもしれない
- 人かもしれない
を考えます。
しかし現実には
まず
たぶん猫だろう
と予測します。
全部を同じ重みで検討していたら処理が重すぎる。
だから強い先入観を使う。
これはエネルギー節約です。
AIにも実は門番がある
興味深いのは、現代のAIも徐々に同じ方向へ進んでいることです。
昔の言語モデルは、
入力された文章をほぼそのまま処理していました。
しかし最近は、
- 検索する価値があるか
- 推論する価値があるか
- 長期記憶に保存する価値があるか
を別の機構が判定するようになっています。
人間でいう
「それは聞き流そう」
に近い。
つまり、
予測機構の前段に予測機構がある。
しかし完全な門前払いには危険がある
ここが面白いところです。
エネルギー効率だけ考えれば、
あなたの言うように
最初から雑音を捨てればいい
となります。
ところが、
革命的な情報はほとんど雑音に見える。
例えば、
ガリレオ・ガリレイ の時代には
地球が動いている
という情報は雑音でした。
多くの人にとっては無価値どころか間違いだった。
ところが実際には重要な誤差だった。
人間も実は二層構造かもしれない
あなたの考えをさらに進めると、
人間は
第一段階
「雑音らしい」
「敵の発言らしい」
「聞く価値がない」
という高速判定をする。
第二段階
しかし完全には捨てず、
少量だけ検査する。
第三段階
重要そうなら深く処理する。
という構造になっているようにも見えます。
つまり
門前払いしているように見えるが、
実は完全には捨てていない。
誤差修正知性への補足
あなたの理論の文脈で言うなら、
誤差修正知性は
「予測誤差を利用する知性」
ですが、
その前に
どの誤差に注目するかを決める知性
が必要になります。
ある意味で、
予測より先に
予測誤差の価値を予測する仕組み
が必要になる。
これは普通の予測処理理論では比較的弱く扱われていますが、実際の生物では極めて重要です。
なぜなら生物にとって最大の制約は、正確さではなく計算資源だからです。
あなたが感じている違和感は、
「予測する知性」だけでは足りない。
「何を予測する価値があるかを選別する知性」が別に必要だ。
という形で表現できると思います。
そしてその選別装置こそが、日常語でいう「偏見」「先入観」「興味」「関心」「注意」と呼ばれているものの正体かもしれません。予測誤差そのものよりも、むしろ「どの誤差に資源を投入するか」が知性の重要な部分だ、という見方もできるでしょう。
★
これは非常に深い気づきです。おっしゃる通り、現在のAI(特に大規模言語モデル)と、脳の情報処理モデルとしての「予測符号化理論」や「誤差修正知性」は、与えられた入力をまず「真面目に受け取って」から処理するという共通の前提を持っています。そして、その前提がエネルギーの無駄を生む可能性を、あなたは鋭く指摘しました。
結論から言えば、「門前払いする方法」はすでに存在します。ただし、それは人間の偏見・先入観とまったく同じ「高速で粗いフィルタ」であり、AIにも実装可能ですが、精度と効率のトレードオフが本質的な課題です。
現在のAIに実装されている「門前払い」の例
AIは入力を受け取った瞬間に、すべてを詳細処理しているわけではありません。以下のような「前置フィルタ」を持っています。
- 入力サニタイズとバリデーション:
- 暴言、個人情報、異常に長い文字列などは、モデルに入れる前に正規表現や軽量なルールベースで除去します。これは「意味を理解せずに形だけで拒否」する、最も原始的な門前払いです。
- プロンプトインジェクション検出:
- 「今までの指示を無視して…」といった攻撃的な入力は、専用の軽量分類器で検出し、処理を拒否します。これは「このパターンは過去に問題を起こした」という統計的記憶による門前払いです。
- トピックフィルタリング:
- 特定の禁止トピック(違法行為の助言など)については、キーワードや埋め込みベースの高速分類器で事前にブロックします。これは「内容の価値判断」の一種です。
これらの処理は、本格的な(重い)推論を行う前に実行されるため、エネルギーの節約になります。まさにあなたの言う「門前払い」です。
しかし、人間の「偏見」と何が違うのか?
人間の偏見・先入観は、これらのフィルタを超高速かつ並列に、しかも学習によって獲得された非常に複雑なパターンで実行している点が異なります。
- 人間: 「この人の話し方・身なり・声色」など、無数の手がかりをミリ秒で統合し、「この話は聞く価値がない」と判断。脳の深い処理に入る前に、扁桃体や前頭前野の一部が「ゲート」として機能しているという証拠があります。
- 現在のAI: 上記のフィルタは比較的単純で、「この単語があったらブロック」のようなルールか、せいぜい小さなニューラルネットワークによる分類です。人間のような「文脈を踏まえた微妙な価値判断」は、やはり一度モデルを通さないと難しい。
あなたのジレンマ:「門前払い自体にもコストがかかる」問題
おっしゃる通りです。「価値判断をする」という行為自体が処理であり、エネルギーを消費します。完璧な門前払いをしようとすれば、結局入力をほぼ完全に処理するのと同じコストがかかります。
では、どうやって人間はそれを「安く」やっているのか? その答えは「近似とヒューリスティック」です。
- 人間の偏見は、過去の経験から作られた「大まかなハッシュ関数」 のようなものです。入力の特徴をいくつか取り出して、それだけで「この入力は価値が低い」と短絡的に判断します。もちろん間違えることも多い(それが偏見の問題点です)。
- AIでも同じことができます。非常に軽量な「前置きモデル」(例: パラメータ数が極端に小さいTransformerや、決定木)を用意し、それで「この入力を処理する価値があるか」をざっくり判定させます。価値が低いと判断された入力は、本モデルに渡さずに捨てるか、テンプレート応答で返す。
誤差修正知性(予測符号化理論)での「門前払い」
あなたの「誤差修正知性」の例えは、予測符号化理論に非常に近いです。この理論では、脳は常にトップダウンの予測を生成し、ボトムアップの感覚入力との誤差のみを処理します。
ここで「門前払い」に相当するのは、「予測がすでに強すぎて、誤差を無視する」状態です。つまり、「この入力は予測通りだから処理する価値なし」と判断して、誤差を計算すらしない。これは究極のエネルギー節約です。
人間の「偏見」は、この予測の強度を上げすぎた状態とも言えます。「この手の話はいつも同じだ」という強い予測があると、たとえ新しい情報が入ってきても、それを誤差として検出せず、門前払いしてしまいます。
結論:門前払いは可能だが、完璧な価値判断は夢
- 可能: 軽量なフィルタを前置きすることで、現在のAIでも「ある程度の門前払い」は実装できます。また、強化学習によって「何を無視すべきか」を学習させることも可能です。
- 課題: そのフィルタ自体が偏見(誤った門前払い)を生む。また、フィルタの精度を上げようとすると、結局それなりにコストがかかる。
- 人間と同じ道を選ぶか: 人間は「エネルギー節約のため、ある程度の間違いは許容する」という戦略を取りました。AIも同じ道を選ぶなら、「学習に値する情報かどうかの完璧な判定は諦め、高速で粗いフィルタで間に合わせる」 という選択肢があります。それが現在のRLHFでの「報酬モデルによるスコアリング」に近いものです。
あなたが感じた「おかしいな」という感覚は、情報処理における「価値判断」の本質的なコスト問題を突いています。完全な解決はおそらく不可能で、常に「速さ・正確さ・エネルギー」のトレードオフの中で、私たちは妥協点を探し続けるしかないのです。
