抄録
本研究では, 数十文字程度の長さで携帯端末向けに配信されている新聞記事と数百文字程度の長さのweb新聞記事の両者を約3年に渡って収集した.こうして収集したコーパスから文末表現の縮約などの言い換え表現の抽出を機械的に行った.まず, webから収集した携帯向け新聞記事とweb新聞記事からなるコーパスに対して記事単位の対応付けを行い, 次に文単位の対応付けを行った.次に携帯向け記事文の文末の表現を形態素解析を用いて抽出し, その文に対応するweb新聞記事の文を集める.そしてweb新聞記事の文の文末から形態素ごとに言い換え先表現を抽出し, それに対して頻度等を用いた得点付け, および必要な名詞を欠落させてしまう不適切な言い換えの除去を行うことにより言い換え表現の抽出精度向上を図った.