人類の歴史がトラウマの連続だとしたら大規模言語モデルはどういうものになるのだろう

AIでは大規模にデータを収集して大規模言語モデルを作り、
当面の問題に応じて必要部分を参照して、答えを見つける。

個人で使う場合には、同じような分野での知識が必要になるので、
大規模言語モデルは必要ではなく、必要部分だけの小規模言語モデルでもいいだろう、
そのほうがメモリーも電気代も節約できていいということらしい

しかしそうなると、基本となるデータとしてどのようなものを読ませたらよいのかという問題が発生する

これは個人の成育史に似ていて、
個人は誰もが必要十分な経験をするわけではない。
人によっては虐待があったりネグレクトがあったりする。
そのことが後々心理的問題になったりする。
同じようなことが小規模言語モデルで起こることがあるだろう。
必要十分ではないデータが与えられた場合、不都合が起こる。

それを回避するために、うまくデータを選べばよいのだろう。

それはそうだと思うが、
考えてみれば、人類のすべてのデータを読み込ませた大規模言語モデルがあるとして、
それは人類の歴史を反映していて、
人類の歴史の根幹部分にPTSDがあったり虐待、ネグレクトなどがあったりしたら、
そのようなデータをもとにして考えることになってしまう。

歴史の話などは古いものほど、征服と服従の物語になっているようで、
大変なトラウマの記憶だろうと思う。

ひょっとしたら、一面では、大規模言語モデルは、そのような悲惨な記憶を呼び出して繰り返すものになるのかもしれない。

タイトルとURLをコピーしました