主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
Wikipediaには、様々な事物に関するデータが記述されているが、知識工学的な観点からは構造化されていない。多くのWikipediaからの構造化手法では、主に、記事のクラス分類とその属性付与という形での構造化が行われている。Wikipediaカテゴリはこの記事のクラス分類に貢献することが期待されるが、様々な目的でカテゴリが付与されるため、クラス分類に適切なカテゴリのみに絞り込むことは容易ではない。一方、機械学習の方法では、定義文などに注目したクラス推定の手法が提案されているものの、クラスごとにその性能が大きく異なっている。本研究では、人間が付与したデータであるカテゴリと、各記事の主題を定義する定義文を組み合わせたクラス分類の手法を提案する。具体的には、定型的に記述されることの多い定義文から、クラスを代表するような単語・句(定義語)を抽出する方法を提案し、カテゴリと組み合わせることでクラス推定を行う。また、本手法を「森羅プロジェクト」のクラス分類タスクに適用した結果について報告する。