人工知能学会第二種研究会資料
Online ISSN : 2436-5556
2023 巻, SWO-059 号
第59回セマンティックウェブとオントロジー研究会
選択された号の論文の9件中1~9を表示しています
  • 上泉 洸太, 澤村 勇輝, 谷津 元樹, 森田 武史
    原稿種別: 研究会資料
    2023 年 2023 巻 SWO-059 号 p. 01-
    発行日: 2023/03/17
    公開日: 2023/03/23
    研究報告書・技術報告書 フリー

    近年,WikidataやDBpediaなどの大規模知識グラフを利用した質問応答や対話システムが研究されている.大規模知識グラフを対象としたエンティティリンキングは,テキストに現れる名前付きエンティティを知識グラフ内の対応するリソースと結びつけるタスクであり,知識グラフを利用するシステムの基盤技術の一つである.既存のエンティティリンキングツールは,エンティティの正式名称を対象としているものが多い.しかし,TwitterやFacebookなどのマイクロブログには,人名・組織名・商品名・作品名などの略称や非公式名が記述されることが多くあり,そのようなエンティティ名に対してエンティティリンキングを行うことは困難である.本研究は,DBpediaを対象としたエンティティリンキングツールの一つであるDBpedia Spotlight(DS)のモデルを再構築し,苗字または名前で表現される日本人名に対するエンティティリンキングの精度向上を目的とする.本目的を達成するために,DBpediaからPersonクラスのインスタンスのラベル(氏名)を抽出する.その後,Wikipedia記事上の表層形とその出現回数および対応するDBpediaリソースのURIが記載されたファイルの中で,氏名を表層形とするデータに対し,氏名を苗字と名前に分割して表層形として追加し,DSモデルを再構築する.既存の日本語DSモデルと本研究で再構築した日本語DSモデル(提案モデル)を用いて,Twitterから集めた苗字または名前が記載されているツイートに対してエンティティリンキングを行い,両モデルを比較評価し,提案モデルの有効性を示した.

  • 澤村 勇輝, 谷津 元樹, 森田 武史, 江上 周作, 鵜飼 孝典, 福田 賢一郎
    原稿種別: 研究会資料
    2023 年 2023 巻 SWO-059 号 p. 02-
    発行日: 2023/03/17
    公開日: 2023/03/23
    研究報告書・技術報告書 フリー

    自然言語文中のエンティティ名をWikidataなどの大規模知識グラフのリソースと対応づけるタスクであるエンティティリンキング(EL)は,質問応答などの基盤技術として注目されている.最先端のEL研究は英語を対象としており,日本語を対象としたEL研究は少ない.ELモデル構築には言語モデルや知識グラフ埋め込みを利用しており,日本語ELモデルを構築するには言語モデルや知識グラフ埋め込みの日本語対応が必要となる.本研究では,英語ELモデルを日本語対応するための課題の分析を行う.Wikidataを対象とした英語ELモデルPNEL(Pointer Network based Entity Linker)構築において言語依存の埋め込みを変更することにより,日本語ELモデルを構築した.英語データセットであるwebQSP,SimpleQuestions,LC-QuAD2を翻訳し,日本語と英語ELモデルの比較評価から,モデル構築における課題を埋め込み手法の観点から分析した.

  • Yamamoto VictorEiti, 武田 英明
    原稿種別: 研究会資料
    2023 年 2023 巻 SWO-059 号 p. 03-
    発行日: 2023/03/17
    公開日: 2023/03/23
    研究報告書・技術報告書 フリー

    This paper shows an approach to integrating general-purpose Knowledge Graphs (KGs) and domain-speci_c KGs. General purpose KGs cover di_erent topics but lack speci_c topics or details. On the other hand, KGs extracted from speci_c domains usually represent only a small set of entities compared to the general purpose KG, while they represent entities from their domain with more details. So they can complement the information if used together. Current matching approaches are tested on datasets with one-to-one assumption or relatively small instance sizes. This research explored matching KG extracted from speci_c communities and DBpedia as a general-purpose KG in a real-world case. We used a traditional matching algorithm (PARIS) with a BERT model to _lter the result and random walk to expand the possible matches. Firstly, we executed PARIS for the entire KG and selected the obtained matches above a threshold. Secondly, the algorithm embedded the abstract of the entities using the BERT model, calculated the similarity between the vectors, and _ltered the matches. In the last step, the algorithm used the _ltered matches as seeds to apply random walks and created a sub-graph for each KG. Then, the instances of the sub-graphs were matched using string similarity between the labels and similarity between the abstracts using BERT when available on both sides. We tested the proposed approach between the entire DBpedia and our KG and improved the obtained matches. We found that the generated matches contained many entities with de_cient information in DBpedia, so the matching process can be used to identify and complement those entities.

  • 山本 泰誠, 谷津 元樹, 森田 武史
    原稿種別: 研究会資料
    2023 年 2023 巻 SWO-059 号 p. 04-
    発行日: 2023/03/17
    公開日: 2023/03/23
    研究報告書・技術報告書 フリー

    雑談対話システムにおける課題として,対話の文脈とユーザ嗜好の理解が挙げられる.雑談対話システムがユーザとの対話の文脈を考慮せずに,直前のユーザ発話に適した応答のみを行う場合,不自然な対話になることがある.また,ユーザ嗜好を考慮せずに雑談対話システムが応答する場合,ユーザが興味のない話題をシステムがユーザに提示し,対話の継続が困難になることがある.これらの課題を解決するために,ユーザ発話におけるテキストや音声データを用いて,感情極性分析やシステム発話に対するユーザの興味有無の判定を行い,ユーザ嗜好を考慮して雑談可能な対話システムが提案されている.しかし,既存研究では,対話における文脈やユーザ嗜好の知識表現方法が確立していないという課題がある.既存研究は,独自形式で対話の文脈やユーザ嗜好を表現しているため,雑談対話システム間で対話の文脈やユーザ嗜好をソフトウェア可読な形式で共有し,再利用することが困難である.近年,文脈や時空間的な変化を表現するイベント知識グラフが注目を集めており,対話における文脈もイベント知識グラフにより表現できる可能性がある.以上より,本研究では,対話の文脈やユーザ嗜好を表現可能な対話イベントオントロジーおよび対話イベント知識グラフを提案する.ソーシャルロボットFurhatをユーザインタフェースとして,提案する対話イベント知識グラフに基づく雑談音声対話システムを実装した.評価実験より,実装した雑談音声対話システムが対話イベント知識グラフに基づいて,ユーザの興味有無に関する知識を獲得し,それに基づいて応答できることを示した.

  • 青山 仁, 谷津 元樹, 森田 武史
    原稿種別: 研究会資料
    2023 年 2023 巻 SWO-059 号 p. 05-
    発行日: 2023/03/17
    公開日: 2023/03/23
    研究報告書・技術報告書 フリー

    家庭シミュレータVirtualHome(VH)では,動作とその対象物のセットのリストを記載したアクションスクリプトに基づいて,エージェントをVH上で行動させることができる.行動ラベル,日常生活行動説明文,日常生活行動説明文に対応するアクションスクリプトをクラウドソーシングにより集めたデータセットが存在するが,その構築コストは大きく,VH上で実行できないアクションスクリプトがデータセットに含まれる問題がある.日常生活行動説明文から動作のリストを生成する研究が行われているが,VHには動作を行う際の前提条件が存在するため,既存手法により生成される動作のリストを直接VH上で実行することはできない.本研究では,家庭環境知識,依存構造解析,同義語検索,単語埋め込み,文章穴埋め予測を用いて,日常生活行動説明文からその内容に沿ったアクションスクリプトを生成する手法を提案する.提案手法では,日常生活行動説明文中には明示的に記載されていない暗黙的に行わなければならない動作を,家庭環境知識などの外部知識を用いて推論する.提案手法の評価は,上記データセットの中で,実行可能なアクションスクリプトを含むものを用いて行った.VHには,Scene 1から7の7種類の家庭環境に対応するデータセットが存在し,環境ごとに対応するデータセットが異なる.本研究では,部屋の数と種類が一致するScene 1,Scene 2,Scene 4の三つの環境を評価対象とする.VH の環境ごとに用意されたデータセットの日常生活行動説明文を提案システムに入力し,提案システムが生成したアクションスクリプトと正解データを比較し,各環境と三つの環境全体の適合率,再現率,F1値の平均値をそれぞれ求めた.三つの環境全体の適合率の平均値は0.64,再現率の平均値は0.56,F1値の平均値は0.57であった.

  • 鵜飼 孝典
    原稿種別: 研究会資料
    2023 年 2023 巻 SWO-059 号 p. 06-
    発行日: 2023/03/17
    公開日: 2023/03/23
    研究報告書・技術報告書 フリー

    ナレッジグラフ推論チャレンジ【実社会版】で提供されるナレッジグラフを対象に Walk モデルと代数モデルのナレッジグラフ埋め込みモデルを利用したリンク予測の比較を行うとともにノード に対して得られたベクトルをもちいた分類実験を行う.これは,実社会版チャレンジで設定されているメインタスクの一部である危険な状況を検出するための予備実験として行ったものである.

  • 上松 大輝, 金 亜伊, 武田 英明
    原稿種別: 研究会資料
    2023 年 2023 巻 SWO-059 号 p. 07-
    発行日: 2023/03/17
    公開日: 2023/03/23
    研究報告書・技術報告書 フリー

    日本は1年間に1000~2000回の有感地震が観測される地震大国である.地震学の研究も盛んに行われており,気象庁や防災科学研究所,地方公共団体等が地震計による地震観網が整備されている.近年では,観測された大量の地震波形データをもとに機械学習の手法を用いて,地震の検知や分類,震度の予測などさまざまな研究が進められている.地震は,観測された波形をもとに震源の位置や大きさが推定し,観測点ごとに震度を計算しており,「地震」には名称やIDが付与されていない.そのため,学習用のデータを作成するためには,震源の位置や発生時刻,対象とする観測点など研究者が設定し収集する必要がある.本研究では,地震オントロジーを構築し,観測波形や震源の情報をもとに地震にURIを付与することで,学習データとして利用可能な地震カタログの可用性と流通の可能性を検討する.

  • 森 俊人, 谷津 元樹, 森田 武史, 江上 周作, 鵜飼 孝典, 福田 賢一郎
    原稿種別: 研究会資料
    2023 年 2023 巻 SWO-059 号 p. 08-
    発行日: 2023/03/17
    公開日: 2023/03/23
    研究報告書・技術報告書 フリー

    DBpediaやWikidataなどの大規模知識グラフは集合知により構築されるため,人手で構築するのには限界があり,不完全な知識グラフが構築されることがある.この問題を解決するために,知識グラフ中の欠損したエンティティや関係を補完する知識グラフ補完に関する研究が行われている.最近は,知識グラフの埋め込みに基づく知識グラフ補完の研究が注目されている.知識グラフの埋め込みに基づく手法の多くは,学習時に利用する知識グラフ(既存の知識グラフ)に含まれるエンティティの表現ベクトルを用いて関係予測などを行う.既存の知識グラフに含まれないエンティティ(未知エンティティ)は表現ベクトルを計算することができないため,未知エンティティに関する知識グラフ補完を行うことは困難である.最新の話題に対応した知識グラフに基づく質問応答や対話システムを構築するためには,未知エンティティを対象とした知識グラフの構築や補完が必要だと考えられる.本研究は,Wikipediaの赤リンクをDBpediaにおける未知エンティティとみなし,DBpediaを拡張することを目的とする.赤リンクとはWikipediaにまだ存在しない記事(記事名)への,初期設定では赤色で表示されるリンクであり,DBpedia上には赤リンクに対応するエンティティは基本的には存在しない.赤リンクはその性質上,記事が作られるべきであると判断されて作られているため,今後,赤リンクに対応する記事が作成され,DBpediaにおける新たなエンティティとして追加される可能性が高い.本稿では,Wikipediaの記事から赤リンクを抽出して未知エンティティとみなし,DBpediaにおける既存エンティティとの関係構築を行う方法について検討する.

  • 太田 雅輝, 鵜飼 孝典, 江上 周作, 清 雄一, 田原 康之, 大須賀 昭彦, 福田 賢一郎
    原稿種別: 研究会資料
    2023 年 2023 巻 SWO-059 号 p. 09-
    発行日: 2023/03/17
    公開日: 2023/03/23
    研究報告書・技術報告書 フリー

    シーングラフ生成 (Scene Graph Generation) は,与えられた画像内のオブジェクトを検出し,検出したオブジェクトのペアごとの視覚関係を検出する.シーングラフ生成の性質上,Visual Question Answering (VQA) など画像内の視覚的理解を必要とするタスクの基礎を担っている技術である.大規模なデータセットのリリースにより,多くの手法が開発され,シーングラフ生成の分野は大きく発展した.しかし,現在,ロングテール問題がシーングラフ生成の精度向上を妨げる原因となっている.本研究では,シーングラフ生成のデータセットの問題に対して有効なデータサンプリング手法の検討をする.

feedback
Top