人工知能学会全国大会論文集
Online ISSN : 2758-7347
第34回 (2020)
セッションID: 4Q2-GS-9-02
会議情報

ニューラル対話応答生成のための言語非依存な低品質対話データフィルタリング法の提案と分析
*赤間 怜奈横井 祥鈴木 潤乾 健太郎
著者情報
会議録・要旨集 フリー

詳細
抄録

深層ニューラルネットワーク技術を用いた文生成(機械翻訳,自動要約,対話応答生成など)の研究領域では,訓練データの高品質化によりモデルの性能向上を図るアプローチが脚光を浴びている. 本研究では,ニューラル対話応答生成モデルの性能向上に向けて,訓練データ中の低品質な発話--応答ペアを検知するスコア関数を提案する.具体的には,「典型的な句の呼応関係の有無」と「話題の一貫性」のふたつの観点に着目し,連続する2発話について「対話(発話--応答ペア)としての許容度」をスコアとして算出する.提案法は特定の教師データを必要とせず,言語やドメインなどのデータの特性に依存しないため,理論上任意の対話データに適用できる. 実験では言語および規模の異なる複数対話データに提案法を適用し,提案スコアが人間の主観と相関を持つことを示す.さらに,提案スコアによる訓練データフィルタリングが応答生成モデルの性能向上に有効であることを自動評価および人手評価により示す.「典型的な句の呼応関係の有無」と「話題の一貫性」の各モデルの経験的な性能を確認・分析し,知見を報告する.

著者関連情報
© 2020 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top