人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 3S1-OS-7b-04
会議情報

日本語医療テキスト平易化の訓練用データセットの構築
*堀口 航輝梶原 智之二宮 崇若宮 翔子荒牧 英治
著者情報
会議録・要旨集 フリー

詳細
抄録

本研究では、医療用語を患者が理解しやすい表現に言い換える日本語の医療テキスト平易化に取り組む。医師によって記述される医療文書には専門用語が多く含まれるため、非専門家である患者はその情報を有効活用できない場合が多い。そのため、医療用語を用いずに入力文を言い換える医療テキスト平易化が期待されている。本研究では、日本語における医療テキスト平易化の少資源問題に対処するために、医療テキスト平易化モデルの訓練用パラレルコーパスを構築する。具体的には、オンライン医学辞典における専門家向けおよび一般向けの記事対の中で自動的な文アライメントを実施し、医療テキスト平易化のためのパラレルコーパスを自動収集する。本稿では、コーパス構築の方法について説明するとともに、本コーパスを用いて訓練した日本語の医療テキスト平易化モデルの性能について報告する。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top