近年,生成AIの発展に伴い,Self-Attentionを中核とするTransformerアーキテクチャーが,自然言語処理や画像生成をはじめとする多くの分野で重要な基盤技術として注目されている.本稿では,Self-Attentionの数理的基盤に焦点を当て,Query・Key・Valueの導出と役割,類似度スコアの算出とSoftmaxによる正規化,さらに加重平均による出力生成の過程について段階的に解説する.あわせて,TransformerにおけるAttention機構の設計思想と構造的特徴を整理し,生成AIにおけるSelf-Attentionの意義を明確にすることを目的とする.数式や図を交えて直観的理解を促すことで,医用画像分野における今後の応用展開の基盤形成に資することを期待する.
本論文では,人工知能(AI)の医療分野への応用について,特に大規模言語モデル(LLM)と生成AIを中心に議論する.AI技術の進展により,従来の統計モデルから深層学習への移行が進み,自然言語処理(NLP)分野において,BERTやLLMなどの技術が重要な役割を果たしている.これにより,医療分野では従来の難解なタスクが簡便化され,業務の効率化が期待される.特に,定型的な患者対応(同意取得,がん相談など)や医療文書作成支援において,LLMを活用した自動化が進んでいる.さらに,医薬品有害事象の抽出や診療録のデータベース構築など,実際の医療データ処理にもLLMが導入されており,従来の複雑なシステムが簡便に実現される可能性が高まっている.これにより,NLP研究者の負担が軽減され,医療現場でのAI活用が普及することが予測される.本論文は,LLMが医療分野においてどのような変革をもたらすか,またその社会的影響について概観し,今後の展望を示す.
現在広く使われる画像生成AIの多くは,Diffusion Modelを用いて画像生成を行っている.従来の画像生成モデルと比べてDiffusion Modelは学習が安定しており,高品質な画像の生成が可能である.そのため,一般画像だけでなく医用画像処理でも活用が進み,Diffusion Modelを用いた医用画像生成手法やセグメンテーション手法が多数提案されている.先端的な研究を行うためにはDiffusion Modelを取り巻く研究動向について把握しておく必要がある.本稿では,Diffusion Modelの仕組みを概説し,医用画像生成や医用画像セグメンテーションにおける応用例を紹介する.さらに,Diffusion Modelの実装例も紹介する.
医療分野において,完全なアノテーションが与えられた学習データを収集することは難しい.本論文では腹部超音波画像からの肝腫瘍検出を対象に,画像内の一部の腫瘍に位置情報を与えた,部分的にアノテーションされた転移性肝がんの検出についてYOLOv3の損失関数を調節する手法を提案する.YOLOv3の損失関数の背景領域に関する項に対して腫瘍の種類に応じた重みを加えることで,アノテーションがない腫瘍に対する検出精度の改善を試みた.転移性肝がんの重みのみ小さくした実験の結果,転移性肝がんに対する再現率の向上が確認された.また,重み0.1のとき,アノテーションが与えられた転移性肝がんの適合率は1割程度低下したが,これは評価データにおいてアノテーションが与えられていない腫瘍を検出したためである.他の腫瘍においては再現率,適合率ともに精度に変化はなかった.この結果から,本手法の有効性が示唆された.