主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
近年,ニューラルネットを用いた言語変換・生成に関する研究の発展は著しいが,文の集合である文書から文書への変換・生成を目的とするタスクは,それほど多くない.本稿は,文書の中でも特に宿泊施設のレビュー文書からそれに対する宿泊施設側の応答文書のたたき台の生成を目的とする.応答文書の中には定型文のような文も混ざっているが,相手のレビュー文書の内容を汲み取った返信をすることが求められる.またレビュー文書と応答文書は必ずしも1対1,もしくは順序通りに対応しているとは限らないため,文単位ではなく,文書単位の変換が必要になる.文の集合である文書を扱うために,文書表現と文表現を同時に学習する階層的Encoder-Decoderモデルをベースとし,少ないデータでより汎用的な文表現を獲得するためにBERTによって事前学習した文の分散表現を入力とする比較的単純なモデルを提案する.提案手法では,従来の文変換や文書表現獲得のために用いられていたモデルを利用する手法より,詳細にレビュー文書の内容を汲んだ応答文書を生成することができた.