我々は,利用者が信憑性を判断する上で必要となる情報を Web 文書から探し出し,要約・整理して提示する,情報信憑性判断支援のための要約に関する研究を行っている.この研究を行う上で基礎となる分析・評価用のコーパスを,改良を重ねながら 3 年間で延べ 4 回構築した.本論文では,人間の要約過程を観察するための情報と,性能を評価するための正解情報の両方を満たすタグセットとタグ付与の方法について述べる.また,全数調査が困難な Web 文書を要約対象とする研究において,タグ付与の対象文書集合をどのように決定するかといった問題に対して,我々がどのように対応したかを述べ,コーパス構築を通して得られた知見を報告する.
抄録全体を表示