人工知能学会全国大会論文集
Online ISSN : 2758-7347
第35回 (2021)
セッションID: 4J3-GS-6f-03
会議情報

ノウハウ読解用コンテキストデータセットの作成および評価
*白 書霆李 廷軒鈴木 勢至宇津呂 武仁河田 容英
著者情報
会議録・要旨集 フリー

詳細
抄録

TF-IDF法によるコンテキスト検索手法,および,ノウハウ機械読解タスク用に fine-tuning済みのBERTを連結した大規模ノウハウ機械読解の手法を提案する. そして,その実現のための,ノウハウ機械読解用コンテキストデータセットの作 成方法を提案する.先行研究により,インターネット上のノウハウサイトに掲載 されているコラムページは,ノウハウ質問回答事例の作成において有効な情報源 として使用できるという分析結果が報告された.この結果を踏まえ,先行研究で は,ノウハウサイトを選定し,ノウハウサイトに掲載されているコラムページを 収集し,ノウハウ質問回答事例集を作成した.そこで,本論文では,先行研究に おいて作成されたノウハウ質問回答事例に加えて,コラムページ上で未使用の段 落を収集し,これを用いて大規模ノウハウ読解タスクにおける検索用コンテキス ト集合を作成する.そして,大規模ノウハウコンテキスト集合に対して,大規模 ノウハウ機械読解タスクを適用し,一定以上の性能のもとで,大規模ノウハウ読 解が行えることを示す.

著者関連情報
© 2021 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top