2018 年 25 巻 2 号 p. 223-249
難解なテキストと平易なテキストからなる大規模な単言語パラレルコーパスを用いて,テキスト平易化が活発に研究されている.しかし,英語以外の多くの言語では平易に書かれた大規模なコーパスを利用できないため,テキスト平易化のためのパラレルコーパスを構築するコストが高い.そこで本研究では,テキスト平易化のための大規模な疑似パラレルコーパスを自動構築する教師なし手法を提案する.我々の提案するフレームワークでは,リーダビリティ推定と文アライメントを組み合わせることによって,生コーパスのみからテキスト平易化のための単言語パラレルコーパスを自動構築する.統計的機械翻訳を用いた実験の結果,生コーパスのみを用いて学習した我々のテキスト平易化モデルは,平易に書かれた大規模なコーパスを用いて学習した従来のテキスト平易化モデルと同等の性能で平易な同義文を生成できた.