主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
固有表現と意味役割は文章生成・理解において中核的な役割を担う。 Wikipedia文書とそれと整合する形で整備されたLinked DataであるWikidataとの組は、構造化された知識と、文章中の固有表現に対して特定の意味的役割を与える言語的特徴との対応を知る上で、重要な研究資源である。 本稿では、Wikidata上でproperty-value関係を持つvalue値が表出する言語表現を調査する。 具体的には、当該propertyを表現する上での特徴となる言語表現を、SVM(Support Vector Machine)を用いた素性選択手法を適用して明らかにする。 さらに、それらの特徴的な言語表現が、一つの説明文章の中に低頻度で出現し、性質の異なるpropertyを説明する文章と明確に区別できることを確認した。 この知見は、文章でproperty-valueが記述されているにも関わらず、Wikidata上でproperty-valueが設定されていない不整合を是正することに役立つことを示す。