主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
ビジネス会議では,異言語話者間で情報交換が行われることがある.このような状況での円滑なコミュニケーションを促進するため,話し言葉を対象とした機械翻訳(MachineTranslation, MT)のニーズが高まっている。話し言葉は指示代名詞や省略表現が多い,固有名詞や固有表現が多いといった傾向があるため, 話の流れ(文脈情報) を考慮して翻訳(文脈翻訳)を行う必要がある.本研究では,ビジネス会議を想定し,日 ↔ 英の翻訳を対象に,大規模言語モデル (Large Language Model, LLM)を用いた文脈翻訳についての研究を行う.実際の会議に即した評価を行うため,我々は実際の会議音声データの書き起こしと対訳を行い、データセットを作成した.またプロンプトに効果的な文脈情報を含めるため,原言語文の意味類似度と共参照解析を活用した文脈文選択手法を提案する。自動評価指標を用いた評価の結果,英 → 日、日→英方向で異なる手法による訳質改善を確認した.