自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
仕事文推敲支援に向けた連体修飾部不足に対する受容性判定法
梅村 祥之増山 繁
著者情報
ジャーナル フリー

2007 年 14 巻 4 号 p. 43-65

詳細
抄録

文章推敲に関する従来研究では, 主に, タイプミス, 構文構造の複雑さ, 表記の揺れを指摘する手法など, 表記レベルと統語レベルの手法に重点がおかれていた.それに対して, 本研究では, 読みやすさを向上させるために, 説明が不足していて論理展開が読み取りにくいと感じられる箇所を検出する技術を扱う.文章としては情報を正確に伝達するための仕事文 (仕事用の文) を対象として, 文単位での情報不足を推敲対象とする.この課題は意味処理に踏み込むため, これまで十分研究が行われてこなかった.なお, 語用論の「協調の原理」によれば, 量の格率と呼ばれる情報不足と情報過多に関する遵守すべき原則がある.このうち情報過多を扱わない理由は, 情報過多が, 冗長な情報を無視するのに基づく読者の負担を増やすだけであるのに対し, 情報不足は理解困難という深刻な事態を招き, 重要性が高いためである.実験準備から解析に至る流れは, 次の通りである.まず, 原文から連体修飾部を欠落させた課題文を生成し, 次に, 被験者にその箇所に情報不足を感じるかどうかを判定させ正解判定データを作成した.その後, 正解判定データの一部から機械学習を行い, 残りのデータを機械判定させる.機械判定に用いる主な素性として, 修飾部の欠落箇所におけるつながりの滑らかさに関係した語の連鎖に関する統計量を取り上げた.約1,000箇所の判定課題に対し, SVMによる機械学習アルゴリズムを用いた自動判定により正解率を測定した結果, 機械判定の正解率として, ベースライン50%, 上限 (人間の評価のバラツキから上限を定義) 76%に対し, 10-fold crossvalidationで67%の正解率を得た.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top