人工知能学会全国大会論文集
第35回 (2021)
セッションID: 1D2-OS-3a-03
会議情報

MMRによる文選択とTF-IDFによる文圧縮を用いたニュース記事要約
*石原 祥太郎澤 紀彦
著者情報
会議録・要旨集 フリー

詳細
抄録

本研究では,ニュース記事を文章選択・圧縮で要約する手法を提案する.具体的には,記事を代表するN個の文章を抽出し,構文解析で各文章を圧縮する.指標としてMMR(Maximal Marginal Relevance)とTF-IDF(Term Frequency - Inverse Document Frequency)を用いた.実験の結果,提案手法は人間の編集者の作業と約26.7%の割合で同一の話題に言及していた.必ずしも高い一致率とは言えないが,それ以外の生成物も日本語として誤りが少なく,候補として採用できるものが多かった.提案手法には特定の語句の重み付けなどで編集者の意図を組み込みやすく,編集者の負担軽減に繋がる利点がある.

著者関連情報
© 2021 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top