ChatGPTが使いがちな英単語

ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。

ChatGPTが「commendable」「innovative」「meticulous」あたりの単語を頻出する

事態の裏側にある真相が、既に報道で取り上げられています。
それは、ChatGPTのRLHF(ヒトのフィードバックによる強化学習)プロセスの多くが、アウトソースされた(比較的人件費の安い)ナイジェリアのオペレーターたちによって行われた結果である、というものです。
そもそも、例えば”delve”という単語はナイジェリア英語ではビジネスフレーズの中では比較的頻繁に用いられるそうで、それらのナイジェリア英語によるチューニングの結果がChatGPTの出力に影響している、ということのようです。

勝手な憶測ですが英文校閲などの非英語話者向けの学術論文出版支援サービスがナイジェリアで増えていて、世界中でその利用者が増えたとかいうこともあるのかなと

その結果起きることは、「生成AIが流行らせた慣用表現を使ったドキュメントが世界中に溢れる」→「その世界中に溢れたドキュメントを使って次の生成AIがまた学習する」→「その生成AIが……」というフィードバックループであり、いずれは生成AIが流行らせた慣用表現で世界中のドキュメントが埋め尽くされる、という事態になっても不思議ではないどころか、ほぼ既定路線なのではないかとすら思われます。

報道でも指摘されているように、仮に例えば”delve”が多いからという理由で論文をリジェクトしたりドキュメントをゴミ扱いしたりすれば、それも問題。

タイトルとURLをコピーしました