主催: 一般社団法人 人工知能学会
会議名: 2022年度人工知能学会全国大会(第36回)
回次: 36
開催地: 京都国際会館+オンライン
開催日: 2022/06/14 - 2022/06/17
雑談対話応答生成において,英語や中国語と比較すると,日本語のデータセットとしては公開されている質の高いコーパスはあまり多くない.そのため小さいデータや質の低いデータで十分な性能の雑談対話応答生成を行うために,本研究ではTransformerベースのモデルに中国語と英語からの転移学習を利用した.データセットとしては3つの日本語コーパスとTwitterから収集したコーパスを利用し入力文に対しての生成を行った.生成結果の自動評価指標としてdistinct-1の平均の値は,転移学習なしでは0.368,転移学習モデルの平均は0.412という値となった.また,人手評価としては、文の繋がり、情報の多さ、人間らしさという3つの項目に関して、対話数が9343文の小さな学習データに対し,転移学習無しのモデルと比較してすべての項目で転移学習ありのモデルが大きく良いスコアを示した