自然言語処理

自然言語処理特集号「自動要約」

森辰則

2002 年 9 巻 4 号 p. 1
発行日: 2002/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.9.4_1

ジャーナルフリー

PDF形式でダウンロード (137K)
検索結果表示向け文書要約における情報利得比に基づく語の重要度計算

森辰則

2002 年 9 巻 4 号 p. 3-32
発行日: 2002/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.9.4_3

ジャーナルフリー

抄録を表示する抄録を非表示にする

本稿では, 情報検索の結果として得られた文書集合中の各々の文書を要約する一手法を提案する. この場合の要約の質は, 検索質問一要約文書間の関連性判定が, 検索質問一原文書の間の関連性判定に一致する度合で評価されるので, 検索を考慮した要約が必要となる. 検索質問により語の重みにバイアスを与え, 語の重要度を求める従来手法とは異なり, 我々の方法では, 検索された文書間の表層的類似性を適切に説明する語に高い重みを付与する. 具体的には, 検索文書集合に階層的クラスタリングを適用することにより, 文書間の類似性構造を抽出するとともに, 各クラスタにおける各語の出現確率から, その構造を説明するのに寄与する単語により高い重みを与える. 我々は, その重みづけに情報利得比を用いることを提案する. そして, この語の重み付けに基づき重要文抽出方式による検索文書要約システムを実装した. このシステムを評価型情報検索ワークショップであるNTCIR2におけるText Summarization Challengeの情報検索タスクにより評価した結果, 関連性判定において検索質問バイアス付きTF方式, リード文方式によるベースライン手法ならびに, 他参加システムよりも, 良好な結果を示した.

抄録全体を表示

PDF形式でダウンロード (3045K)
テキスト要約の複数の正解に基づいた評価

石川開, 安藤真一, 奥村明俊

2002 年 9 巻 4 号 p. 33-53
発行日: 2002/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.9.4_33

ジャーナルフリー

抄録を表示する抄録を非表示にする

本稿では, 要約手法として複数の正解に基づく評価法の提案を行なった.従来のテキスト要約の評価方法では唯一の正解を用いるが, テキストによっては観点の異なる正しい要約が複数存在する場合もあり, 評価の信頼性が保証されないという問題があった.我々は, 自動評価の信頼性を高めるため, 特に重要文抽出法に焦点を当てて複数の正解に基づく評価方法を検討した.提案手法では, 複数の正解と評価対象の要約を共にベクトルで表現し, 複数の正解の線形結合と評価対象の要約との内積の最大値を評価値とする.提案手法の検証のために, NTCIR-2要約データ中の4記事に対して, 要約者7名で要約の作成を行なった.正解の要約問の一致度に基づく品質評価の結果, 提案手法の評価の正解として用いるのに十分な品質が得られなかったが, 要約の比較から, 照応関係, 結束性等, 元テキスト中の構造を損なわないように要約する共通の法則性が見出され, 今後要約の正解を作成する上で有用な知見を得た.提案手法の有効性を検証する予備実験として, 異なる幾つかの自動要約手法と複数正解との一致度に基づく評価を行なった.正解ごとに評価の高い自動要約手法が異なるという傾向が見られ, 複数の正解を用いることで評価対象の要約との相性によらない評価結果を得るという提案手法の前提を裏付ける結果を得た.

抄録全体を表示

PDF形式でダウンロード (3733K)
重要語句抽出による新聞記事自動要約

畑山満美子, 松尾義博, 白井諭

2002 年 9 巻 4 号 p. 55-73
発行日: 2002/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.9.4_55

ジャーナルフリー

抄録を表示する抄録を非表示にする

本論文では, 格フレーム辞書を用いて原文の重要語句を抽出し, 抽出された語句を再構成することにより要約文を生成する新聞記事要約手法を提案する. この手法に基づいて新聞記事自動要約システムALTLINEを試作し, 人手要約との比較により評価を行なった. この結果, 提案手法によって人間の要約に匹敵する要約文が生成できることが分かった.

抄録全体を表示

PDF形式でダウンロード (2694K)
句表現要約手法に基づく要約システムの開発と評価

上田良寛, 岡満美子, 小山剛弘, 宮内忠信

2002 年 9 巻 4 号 p. 75-96
発行日: 2002/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.9.4_75

ジャーナルフリー

抄録を表示する抄録を非表示にする

検索結果のふるいわけに適した要約生成手法を開発した. 多くの要約システムでは重要文選択という手法を採用しているが, この方法による要約は長く複雑な文になりがちである. 我々が開発した句表現要約手法は, 短い句を列挙することで, そのような長い文を読む際に生じる負荷を軽減する. 各句は, (1) 係り受け解析により単語間の関係を抽出, (2) 係り受け関係からコアになる関係を選択, (3) 句に意味のまとまりを持たせるのに必要な関係を付加, (4) このようにして作られたグラフから表層句を生成, という手順で作られる. この手法の効果を評価するため, タスクベース評価法の改良を行った. この方法では, 検索が必要になった背景を含めたタスクの詳細まで規定すること, ひとつの要約を10名の評価者で評価して個人差の影響を少なくすることにより, 正確性を増している. また, 適合性の評価に複数のレベルを設けることで, 様々な状況における適合率・再現率の評価を可能にした. この方法で評価したところ, 句表現要約が情報検索結果のふるいわけに最も適していることがわかった. この結果は, 生成された句が比較的短く, 文書中の重要な概念を広くカバーするということから得られたものと考えられる.

抄録全体を表示

PDF形式でダウンロード (12880K)
テキスト自動要約に関する最近の話題

奥村学, 難波英嗣

2002 年 9 巻 4 号 p. 97-116
発行日: 2002/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.9.4_97

ジャーナルフリー

抄録を表示する抄録を非表示にする

本稿では, 1999年の解説の後を受け, テキスト自動要約に関する, その後の研究動向を概観する. 本稿では, その後の動向として, 特に最近注目を集めている, 以下の3つの話題を中心に紹介する.
(1) 単一テキストを対象にした要約における, より自然な要約作成に向けての動き,
(2) 複数テキストを対象にした要約研究のさらなる活発化,
(3) 要約研究における, 要約対象の幅の広がり

抄録全体を表示

PDF形式でダウンロード (2350K)

J-STAGEへの登録はこちら（無料）