活用事例
病理検証×生成AI “AI時代だからこそ”必要な専門家の知見

利用したサービス
ビザスクpartner:エキスパートによる実働型の伴走支援
概要
- エキスパート:病理分野の専門医
- 依頼内容:生成AIが構造化した100本以上の医療レポートの妥当性評価
- 実施施策:20項目の定量的な評価軸でレビューを依頼
こんな方におすすめ
- AIの精度を担保したい企業
- 専門家の見解が社内にない事業部門
- 医療・創薬分野のAI活用を模索する担当者
所属されている部署のミッション
株式会社日立製作所の医薬システム本部は、製薬会社、医薬卸や病院などのヘルスケアに関わるお客様向けにSIビジネスやサービスビジネスを展開しており、近年はデジタル技術を使った新規ソリューション開発と導入に力を入れています。特にヘルスケアデータ解析プラットフォームである「B3 Analytics」は、日立独自開発のAIであり、創薬研究・臨床開発・製造販売後調査などで活用されています。今回は、生成AIの精度検証を担当された医薬システム本部の皆様に、外部専門家活用の取り組みについてお話を伺いました。

ボトルネックは”正しさの検証”
Q. 今回の取り組みを始める前、どのような課題がありましたか?
解析受託の事業をご提供する中、あるお客様の扱っている専門的なレポートのデータ化(構造化)に「生成AIを活用できないか」を提案しまして、構造化プロセスの自動化を進めてきました。
しかし、AIが出力した構造化結果の“正しさ”を検証する作業においては、忙しい依頼元のお客様に確認をお願いすることが現実的でなく、一方で専門性に劣る社内メンバーのみで大量の結果をレビューすることにも限界がありました。加えて、これまでの検証結果は主観的なコメントに留まっており、定量的な評価指標を得ることができていませんでした。
「AIが正しい」と言い切れる根拠がなければ、プロダクトとして次のステップに進めない。そうした閉塞感のなかで、第三者による客観的かつ体系的な評価体制の構築が不可欠だと判断しました。
専門家による評価体制を構築
Q. 課題を解決するために、どのようなサービスを活用しましたか?
AIの出力の妥当性を検証するために活用したのが「ビザスクpartner」です。生成AIが構造化した医療レポートについて、該当領域の専門家にレビューしていただきました。
実際に依頼したのは100本以上のレポートで、20項目程度の確認基準を設け、どこに誤差が出るかを定量的に評価していただきました。その結果、AIの得意・不得意が明確になり、チューニングの方針を立てるうえでも非常に有効でした。
医学の細かい知識が必要な専門性の高い領域で、ビザスクから5〜6人も候補が出てきたのには驚きました。候補者の経歴も比較できたので、安心感がありましたし、プロジェクト単位で依頼ができる点や、システム上で日程調整ができるため利便性も高かったです。
今回のエキスパートを選ぶ際には、経歴が豊富で、案件に対する理解力も高く、AIに対して前向きなスタンスを持っていたことが決め手でした。実際、この分野にはAI導入に慎重な姿勢を持つ方も多いのですが、今回依頼した方は非常に前向きに体制構築に協力してくださり、安心してお任せできました。
AIの苦手ポイントの定量データ化を実現
Q. どのような成果が得られましたか?
最大の成果は、生成AIの出力精度を“第三者の視点”で定量的に評価できたことです。これまでは社内や関係医師の定性的なレビューが中心で傾向が見えづらかったのですが、100本以上のレポートを専門家に体系的にチェックしていただいたことで、誤判定のパターンやAIの苦手とする表現が数値として“見える化”され、改善すべきポイントが明確になりました。
さらに、この取り組みをきっかけに、生成AIの精度確認プロセスを効率化する社内アプリの開発にもつながるなど、副次的な効果も得られました。
実際に、ご依頼元のお客様からも「忙しくてすべて確認するのは難しかったので、このような支援はありがたい」という声をいただき、現場の負担軽減にもつながりました。当初の7本程度の時は自分が1本1本目視で確認していましたが、レポートがその後、400本を超えた現在となっては外部の専門家に依頼して本当に良かったと実感しています。
AI時代だからこそ、人の専門知見の価値がますます高まっていると実感
Q. 今回の取り組みを通じて得られた学びや今後の展望について教えてください。
今回の取り組みを通じて、AI時代だからこそ「人の専門知見」がますます重要になっていると実感しました。AIの活用は進んでいますが、その出力結果が本当に正しいかどうか、最終的に判断するのはやはり人です。特に医療のように専門性の高い領域では、人の目による妥当性の担保が欠かせません。
また、専門家との協業は、単なる作業支援にとどまらず、社内に知見を取り込む良い機会にもなりました。今回得られた知見は、今後のプロンプト設計や評価アプリの改善にも活かしていきたいと考えています。
Q. 他にはどのようなサービスを活用していきたいですか?
聞きたいことが明確であれば「ビザスクexpert survey」、深掘りが必要なときは「ビザスクinterview」と使い分けています。医師などの専門家に直接話を聞けることで、研究や臨床分野での新たな接点が生まれ、営業経由では得られないようなフラットな意見を得られる点も非常に魅力的に感じました。
今後はユーザー体験の検証やデータ活用、さらには認知度調査などの領域でも、ビザスクを活用していきたいと考えています。
- 目的
- 業種
- 部署