2020 年 27 巻 4 号 p. 753-779
論述構造解析は,小論文などの論述文を解析対象とし,節や文といった談話単位の役割(主張,根拠など),談話単位間の関係(支持,反論など)を予測するタスクである.論述文の自動評価や意見の集約などへの応用可能性から,本タスクは注目を集めている.論述構造解析では,談話単位(スパン)が処理の基本単位となるため,スパンに対する特徴ベクトル表現(分散表現)を,どのように計算するかはモデル設計における重要な点である.本研究では,自然言語処理の諸タスクにおけるスパン分散表現の研究を踏まえ,論述構造解析において効果的な談話単位のスパン分散表現の獲得方法を提案する.文章中の機能的な表現(接続表現)と論理的な筋を構成する内容(命題)というそれぞれの粒度で文章の大域的な文脈情報を捉えることが重要であるという仮定に基づき,提案法では各談話単位に複数のレベルの大域的な文脈情報を取り込む.本スパン分散表現を用いることにより,特にこれまでの手法では同定が困難であった複雑な構造をもつ論述文において,解析性能が向上し,複数のベンチマークデータセット上で最高性能を更新した.また,BERT などの強力な言語モデルから得られる単語分散表現を用いた際にも,既存のスパン分散表現獲得方法では十分な性能が得られないが,提案手法によりスパン分散表現の獲得方法を工夫することで,性能が大きく向上することを報告する.