自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
国会会議録を対象とする話し言葉要約
山本 和英安達 康昭
著者情報
ジャーナル フリー

2005 年 12 巻 1 号 p. 51-78

詳細
抄録
換言・削除規則を用いた国会会議録の要約手法とその評価について報告する.国会会議録には, 丁寧表現の頻出や独特な言い回し等の特徴がある.また, 会議における発言の書き起こしであるため, 話し言葉の特徴も見られる.本論文では, この様な特徴的な表現に着目し, 換言・削除することで要約を試みた.まず, 単語n-gramの統計結果から得られた頻出する敬語表現を普通体の表現に言い換えた.次に, 手がかり語を用いて頻出する冗長な表現や挿入句を推定し削除することによって要約した.これらの処理を約20年分の会議録に対して行なった結果, 自由発話が含まれる会議録では80%程度の要約率が得られた.また, CSJコーパスに対して本システムを適用した結果, 平均要約率が約84%であった.したがって, 本システムが国会会議録以外の話し言葉データに対しても有効に働くことを確認した.
著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top