ハルシネーション
生成AIを活用されている方であれば、いちどは耳にしたことがある単語だと思います。
ハルシネーションを簡潔に説明すると、「あたかも正確であるかのように(もっともらしく)、実際には間違っている情報を生成AIが出力してしまう現象」です。
この現象は、生成AIが次の単語や文字を「確率的に」予想して出力する仕組みとも関連しています。生成AIの仕組みでも説明した通り、
- 「どの単語が次に来る可能性が高いか」を計算して選ぶ
- その積み重ねで文章をつくる
という仕組みで回答を生成しているため、どれだけモデルの性能が進歩しても「正解ではない選択肢」を選んでしまう可能性があるのです。よって、生成AIを活用する場合は、出力された回答の内容を再度必ずチェックする必要があります。
ハルシネーションを含む出力の例
実際、生成AIの出力に触れられるハルシネーションの例を確認してみましょう。

この回答の内容は一見正しく見えますが、アドシルカ®︎との併用禁忌に触れられていません。
他のタダラフィル製剤に関しては、クラリスロマイシン(他、CYP3A4を強く阻害または誘導する薬剤)とは「併用注意」となっていますが、アドシルカ®︎は明確に「併用禁忌」となります。
仮に薬剤師がこの出力を確認せずに、この内容をそのままアドシルカ®︎を服薬している患者さんに情報提供してしまった場合、重篤な健康被害につながる可能性があります。
よって、業務内で生成AIを活用する場合は、出力の内容を必ず確認しなければなりません。
もちろん、明らかに誤った回答(そもそも質問の意味を履き違えているなど)であれば簡単に排除することができますが、上画像のような専門的な内容のケースでは、使用する薬剤師の知識が不足していると、見逃してしまう可能性も考えられます。
生成AIがどのような質問にも回答してくれる時代だからこそ、薬剤師には「専門的な内容の出力を精査できるレベルのスキルと知識」が今まで以上に必要になるのです。
ハルシネーションを減らすには?
1. RAGを活用したツールの利用
生成AIを活用する側ができる対策として、信頼できる情報源を提示して、その情報から回答を生成してもらう「RAG(Retrieval-Augmented Generation:検索拡張生成)」を活用する方法があります。RAGを活用した生成AIの代表例として、NotebookLMが挙げられます。
この方法により回答の正確性が増しますが、情報源の内容自体に誤りがあったり、最新の情報にアップデートされていなかったりすると、生成AI側は情報源の内容に忠実に回答を生成するため、逆に回答の正確性を大幅に低下させてしまいます。
2. 入力(プロンプト)の内容を具体的に
突然ですが、「コンプライアンス」「インシデント」という2つの単語を考えてみましょう。
調剤薬局で勤務する薬剤師の大半は、これらの単語の意味を以下のように理解されていると思います。
- コンプライアンス:治療方針を理解し、指示された通りに薬が服薬すること。
- インシデント:調剤・監査・服薬指導において何らかのエラーが発生しかけたが、未然に防止できた事例(ヒヤリ・ハット)。
ただ、実際の世の中では、以下のような意味で使われることもあります。
- コンプライアンス:規範の遵守(むしろこちらの意味の方が一般的)。
- インシデント:情報セキュリティ界隈では、実際に起こったサイバー攻撃などの事例のことを指す(調剤薬局におけるアクシデントに近い)。
この情報を踏まえて、服薬状況の改善を目的として「調剤薬局でコンプライアンスの改善に関して話をしています。良いアイデアを出してください」と質問したとしましょう。ユーザーは服薬コンプライアンスの話をしていますが、生成AI側はこの情報だけですと「服薬コンプライアンスが悪い患者さんの話をしているのか」「調剤薬局の運営に関する話をしているのか」の判断に迷う可能性があります。特に最近は「アドヒアランス」の考え方も浸透しているので、生成AIが「規範の遵守」の意味合いで回答を生成する可能性が十分に考えられます。
こういった情報の齟齬を回避するために、プロンプトの内容は「誤解を招かないよう明確に」記載しましょう。
先ほどの例であれば、
調剤薬局で、服薬コンプライアンス(アドヒアランス)が低下しており、その改善に関してアイデアを募っています。患者さんの情報は以下のとおりです。
<性別、年齢、既往歴、処方薬剤、管理状況などを具体的に記載する(ただし個人情報や機密情報は入力しないように!)>
良いアイデアを、具体的な手順も含めて5つ提示してください。
このように具体的に内容を記載しておけば、正しく理解してもらえるでしょう。
ハルシネーションの「良い」側面
実はハルシネーションは「創造的な回答」「仮説の生成」という、新しい発想からクリエイティブな回答を生成する時にも活用されています。イメージとしては、普通なら選択されることがないような「確率が低い回答」を、あえて選択しているような感じです。
ゆえに、仮にハルシネーションゼロの「正確さ100%」の生成AIが存在したとすれば、以下のような制約をもたらす可能性があります。
- 創造性の低下
- 未知の分野への対応力の低下
- 応答速度低下やコストの増大
- 情報バイアスの問題が生じる可能性
- 「ユーザー体験」の硬直化
もちろん、医療業界や金融業界等で厳格な回答が求められる場面においては、ハルシネーションゼロの方が理想的な場合もあります。
まとめ
- 生成AIによるハルシネーションは、「あたかも正確であるかのように(もっともらしく)、実際には間違っている情報を生成AIが出力してしまう現象」です。
- 「RAG」の活用やプロンプトの改善で、ハルシネーションのリスクを減らすことは可能ですが、生成AIが「確率的に」文章を出力するため、ハルシネーションをゼロにすることは不可能です。よって、出力結果はユーザーが再度確認しなければなりません。
- ハルシネーションには悪い側面だけでなく、「斬新な」「クリエイティブな」回答を生成する時に重要な役割を果たすなど、良い側面もあります。