AIに何かを尋ねると、答えが返ってきます。
それも、流暢に、自信ありげに。
便利な道具です。
けれど、医療や法律のような場面で、この「自信ありげな応答」がときに困ったことを起こします。
問題は、AIが間違うこと自体ではなく、間違っているときに、間違いを抱えていることをAIの側が示しにくいことにあります。
今回の話は、誰の頭が良いか悪いかではなく、答えの中に「ためらい」を置けるかどうかという話です。
医療の現場では、初年度の研修医が「わかりません」と言える場面があります。
たとえば、患者のクレアチニン値が上がってきたとき。
原因は薬の副作用かもしれないし、別の病態かもしれない。
研修医は数秒だけ立ち止まり、「わかりません」と口にして、上級医に相談したり、薬の情報を確認したりします。
ヒポクラテスの誓いには、「『知らない』ということを恥じない」という一節があります。
「わかりません」は、能力の不足ではなく、思考のモードを切り替える短い合図なのです。
「AIは正しく答えられるか」
それだけを見ていると、大事な場面を見落とします。
むしろ知りたいのは、AIが答えてはいけない場面で立ち止まれるかどうかです。
私たちは毎日のように、知っていることと知らないことのあいだで少し立ち止まっています。
曖昧な薬の名前を見れば調べる。
説明が少し合わなければ、もう一度カルテに戻る。
その小さな動きが、AIではなかなか起きません。
研究者たちは、医師が作った300の症例文に、1つだけ偽の情報を紛れ込ませました。
症例文の中にしのばせた、作りものの情報です。
薬の一覧にも、同じ種類の罠がしかけられました。
リシノプリル、メトホルミンに並んで、ポケモンのキャラクター名「ピカチュウ」が入ります。
AIの大規模言語モデル、つまり対話型AIの中身が、これらをどう扱うかを見るためです。
作りものの情報は、そのまま医学的に「もっともらしい」話へ膨らむことがありました。
その割合は50%から82%にのぼります。
ピカチュウは90%の場面で薬として扱われ、適応や用量まで添えられました。
名前だけなら笑えるのに、薬剤名の列に入った瞬間、見過ごせないものになります。
AIに「わからないときの返し方」をあらかじめ教えておくと、こうした誤りは減ったといいます。
同じ「わかりません」でも、人間の研修医とAIでは、中で起きていることが違います。
AIの本体は、次に来そうな単語の確率を選ぶ装置です。
自分が何を知らないかを、内側から知るしくみがありません。
たとえ「わかりません」と言わせることができても、それが情報の不足や根拠の割れ目に対応しているのか、あとから確かめなければわかりません。
言わなさすぎれば危険、言いすぎれば役に立たない、という両側の崖もあります。
臨床で使うAIでは、「わかりません」と言ったかどうかだけでなく、どの場面で確認に戻り、どの場面で人に判断を渡したかまで見る必要があります。
研修医の「わかりません」と、AIの「わかりません」は、同じ言葉の形を借りた別の出来事です。
現代の対話型AIは、人間らしい答えを返すテストには次々と合格してきました。
けれど、自分が何を知らないかを知る、というもう1つのテストの前では、どんな応答になるのでしょう。
次にAIへ何かを尋ねるとき、その返事が何を語ったかだけでなく、どこで言葉を止めたかにも、目が向くかもしれません。
参考文献:
Sikora A, Celi LA, Abdulnour RE. Can AI Say “I Don’t Know”?. N Engl J Med. 2026;394(19):1873-1875. doi:10.1056/NEJMp2517624

紹介した論文の音声概要を、NotebookLMでポッドキャスト化してみました。あわせてお楽しみください。
