自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
9 巻, 4 号
選択された号の論文の6件中1~6を表示しています
  • 森 辰則
    2002 年 9 巻 4 号 p. 1
    発行日: 2002/07/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 森 辰則
    2002 年 9 巻 4 号 p. 3-32
    発行日: 2002/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 情報検索の結果として得られた文書集合中の各々の文書を要約する一手法を提案する. この場合の要約の質は, 検索質問一要約文書間の関連性判定が, 検索質問一原文書の間の関連性判定に一致する度合で評価されるので, 検索を考慮した要約が必要となる. 検索質問により語の重みにバイアスを与え, 語の重要度を求める従来手法とは異なり, 我々の方法では, 検索された文書間の表層的類似性を適切に説明する語に高い重みを付与する. 具体的には, 検索文書集合に階層的クラスタリングを適用することにより, 文書間の類似性構造を抽出するとともに, 各クラスタにおける各語の出現確率から, その構造を説明するのに寄与する単語により高い重みを与える. 我々は, その重みづけに情報利得比を用いることを提案する. そして, この語の重み付けに基づき重要文抽出方式による検索文書要約システムを実装した. このシステムを評価型情報検索ワークショップであるNTCIR2におけるText Summarization Challengeの情報検索タスクにより評価した結果, 関連性判定において検索質問バイアス付きTF方式, リード文方式によるベースライン手法ならびに, 他参加システムよりも, 良好な結果を示した.
  • 石川 開, 安藤 真一, 奥村 明俊
    2002 年 9 巻 4 号 p. 33-53
    発行日: 2002/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 要約手法として複数の正解に基づく評価法の提案を行なった.従来のテキスト要約の評価方法では唯一の正解を用いるが, テキストによっては観点の異なる正しい要約が複数存在する場合もあり, 評価の信頼性が保証されないという問題があった.我々は, 自動評価の信頼性を高めるため, 特に重要文抽出法に焦点を当てて複数の正解に基づく評価方法を検討した.提案手法では, 複数の正解と評価対象の要約を共にベクトルで表現し, 複数の正解の線形結合と評価対象の要約との内積の最大値を評価値とする.提案手法の検証のために, NTCIR-2要約データ中の4記事に対して, 要約者7名で要約の作成を行なった.正解の要約問の一致度に基づく品質評価の結果, 提案手法の評価の正解として用いるのに十分な品質が得られなかったが, 要約の比較から, 照応関係, 結束性等, 元テキスト中の構造を損なわないように要約する共通の法則性が見出され, 今後要約の正解を作成する上で有用な知見を得た.提案手法の有効性を検証する予備実験として, 異なる幾つかの自動要約手法と複数正解との一致度に基づく評価を行なった.正解ごとに評価の高い自動要約手法が異なるという傾向が見られ, 複数の正解を用いることで評価対象の要約との相性によらない評価結果を得るという提案手法の前提を裏付ける結果を得た.
  • 畑山 満美子, 松尾 義博, 白井 諭
    2002 年 9 巻 4 号 p. 55-73
    発行日: 2002/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, 格フレーム辞書を用いて原文の重要語句を抽出し, 抽出された語句を再構成することにより要約文を生成する新聞記事要約手法を提案する. この手法に基づいて新聞記事自動要約システムALTLINEを試作し, 人手要約との比較により評価を行なった. この結果, 提案手法によって人間の要約に匹敵する要約文が生成できることが分かった.
  • 上田 良寛, 岡 満美子, 小山 剛弘, 宮内 忠信
    2002 年 9 巻 4 号 p. 75-96
    発行日: 2002/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    検索結果のふるいわけに適した要約生成手法を開発した. 多くの要約システムでは重要文選択という手法を採用しているが, この方法による要約は長く複雑な文になりがちである. 我々が開発した句表現要約手法は, 短い句を列挙することで, そのような長い文を読む際に生じる負荷を軽減する. 各句は, (1) 係り受け解析により単語間の関係を抽出, (2) 係り受け関係からコアになる関係を選択, (3) 句に意味のまとまりを持たせるのに必要な関係を付加, (4) このようにして作られたグラフから表層句を生成, という手順で作られる. この手法の効果を評価するため, タスクベース評価法の改良を行った. この方法では, 検索が必要になった背景を含めたタスクの詳細まで規定すること, ひとつの要約を10名の評価者で評価して個人差の影響を少なくすることにより, 正確性を増している. また, 適合性の評価に複数のレベルを設けることで, 様々な状況における適合率・再現率の評価を可能にした. この方法で評価したところ, 句表現要約が情報検索結果のふるいわけに最も適していることがわかった. この結果は, 生成された句が比較的短く, 文書中の重要な概念を広くカバーするということから得られたものと考えられる.
  • 奥村 学, 難波 英嗣
    2002 年 9 巻 4 号 p. 97-116
    発行日: 2002/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 1999年の解説の後を受け, テキスト自動要約に関する, その後の研究動向を概観する. 本稿では, その後の動向として, 特に最近注目を集めている, 以下の3つの話題を中心に紹介する.
    (1) 単一テキストを対象にした要約における, より自然な要約作成に向けての動き,
    (2) 複数テキストを対象にした要約研究のさらなる活発化,
    (3) 要約研究における, 要約対象の幅の広がり
feedback
Top