人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 4Xin2-84
会議情報

Wikipediaカテゴリと定義文を利用した記事のクラス分類
*鈴木 希望吉岡 真治
著者情報
会議録・要旨集 フリー

詳細
抄録

Wikipediaには、様々な事物に関するデータが記述されているが、知識工学的な観点からは構造化されていない。多くのWikipediaからの構造化手法では、主に、記事のクラス分類とその属性付与という形での構造化が行われている。Wikipediaカテゴリはこの記事のクラス分類に貢献することが期待されるが、様々な目的でカテゴリが付与されるため、クラス分類に適切なカテゴリのみに絞り込むことは容易ではない。一方、機械学習の方法では、定義文などに注目したクラス推定の手法が提案されているものの、クラスごとにその性能が大きく異なっている。本研究では、人間が付与したデータであるカテゴリと、各記事の主題を定義する定義文を組み合わせたクラス分類の手法を提案する。具体的には、定型的に記述されることの多い定義文から、クラスを代表するような単語・句(定義語)を抽出する方法を提案し、カテゴリと組み合わせることでクラス推定を行う。また、本手法を「森羅プロジェクト」のクラス分類タスクに適用した結果について報告する。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top