Scribble at 2026-06-28 07:15:25 Last modified: unmodified
AI に「心のモデル(ToM: theory of mind)」を設定して運用するというアイデアは昔からある。どうしてこれが AI に必要なのかというと、AI が相手の心の特徴や傾向を知らないままでは正しく応答できない状況が現実に大量に存在するからだ。そして、その心の不確実性を埋める唯一の手段が ToM だからである。ビジネスの世界でも、かなり雑に「メンタル・モデル」とか「マインド・セット」などと呼ばれるし、これを補正することを目的にしている「認知行動療法」といった心理カウンセリングの分野があるのも、よく知られているだろう。色々と呼び方は違うし、もちろんそれぞれ目的や手法も異なるのだが、ヒトには一定の規則性なり傾向があって、それに沿って対応しないといけないという点では一致するはずだ。ということなので、相手の行動(入力されたテキスト情報や画像やファイルの中身)だけでは、相手の意図・信念・知識が分からないことがある。そうすると、たとえば本当は協力したいのに恐怖で攻撃したり、正しい答えを知っていても習慣で間違った行動をするとか、あるいは AI の能力を理解していてもオペレーターが自動化バイアスで誤操作するといったことが起きてしまう。行動に移すと間違いが起きてしまうから、心の状態そのものを推論する必要があるのだ。論文ではこれを "epistemic accuracy(心的状態モデルの正確さ)" と呼び、ToM の最終目的にしている。オンラインで利用するチャットでもよくあるように、AI の応答が過剰で、こちらの能力を過大評価するような応答を出すことがあるのはご存じだろう。相手を過大評価すると過剰な高次推論に走って無用な計算リソースを使ってしまうが、かといって過小評価すると単純化しすぎて読み違えるという応答のミスが起きる。また、ToM を応用する推論プロセスは計算コストが高いので、AI のマシン・パワーを多く使うのだけれど、応答するのにいつでも使うべきであるとは限らないのだ。なので、この論文で議論しているように、「いつ、どういう状況で ToM の推論を使うべきなのか」という考察も必要となる。
論文では、広く使われている DAG を利用して、因果モデルとしての ToM を色々と set-up して、それが有効となる諸条件を考察している。それら諸条件は、(1) 与えられた課題を解けないか解ける見込みがない場合、(2) 応答している相手の能力を誤認した場合、そして (3) 情報の非対称性がある場合だ。ToM は常時オンというものではなく、状況依存で発火する認知メカニズムである。そして、行動ではなく心的状態の正確な推定を目的にすることで、推論と行動方針とを分離し、より堅牢な人工知能を構築できると示唆している。