人工知能学会第二種研究会資料
Online ISSN : 2436-5556
2023 巻, SWO-062 号
第62回セマンティックウェブとオントロジー研究会
選択された号の論文の13件中1~13を表示しています
  • 和田 幸志郎
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 01-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    大規模言語モデルのトレーニングデータに含まれていない専門用語を含む学術テキストを正確に翻訳することは難しい課題である。私たちは、日英辞書を使用したRetrieval-Augmented Generation(RAG)と、日本語のデータセットから作成した知識グラフと英語のデータから作成した2つ知識グラフを利用するRAGの2つの新しいアプローチを提案する。ragasでの実験により、辞書を使用したRAGが翻訳に役立つことを示し、日本語と英語のデータを基に作成された2つの知識グラフを活用したRAGアプローチについても、その性能が決して劣るものではないことを明らかにした。さらに、適切な知識グラフの構築方法によっては、このアプローチが翻訳精度を向上させる可能性があることを示唆している。

  • 上松 大輝, 武田 英明, 山田 奨治, 相田 満
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 02-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    本研究では,明治期に編纂された百貨史料事典である「古事類苑」の知識グラフを構築した.古事類苑には,部,門,項とインデックスが設定されており,さまざまなことがらの説明と引用書や参考資料の情報が記載されている.各インデックスとことがら,および引用書と参考資料の関係性を整理し,古事類苑に合わせたRDFの構造を定義したのち,まずは天部のRDF化を行なった.本論文では,古事類苑のデータ構造と天部のRDF化手順,および作成した知識グラフの活用方法を述べる.また,古事類苑に含まれる情報と,外部リソースとの連携による知識グラフの今後の拡張について検討する.

  • 入江 真弘, 永森 光晴
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 03-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    相互運用性の高いメタデータタームは、そのタームが用いられる文脈によってタームのラベルと異なる役割を持つことがある。しかし、語彙定義やターム同士の関係定義が十分でないため、メタデータに関する知識がない人は、相互運用性の高いタームを、利用者が用いる特定の領域の単語から発見することが難しい。本研究では、相互運用性の高いメタデータタームを、特定の文脈におけるタームの役割を表すシソーラスの概念にLLMを用いてマッピングする手法を提案する。相互運用性の高いメタデータタームを、タームと一緒に用いられるドメインと組み合わせることで、そのタームの役割を表す単語と関連付けることができるのではないかと考えた。メタデータに関する知識がなくても、利用者の言葉からシソーラスを介してタームを探索することで相互運用性の高いタームをより多く発見することが期待できる。

  • 後藤 颯志, 浅野 歴, 森田 武史
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 04-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    ソーシャルロボットが周辺状況と文脈を考慮して,ユーモア表現を生成できるようになれば,人間とのより円滑な対話が可能になると考えられる.本研究では,ユーモア表現として併置型駄洒落に着目し,画像に関連する併置型駄洒落生成を目的とする.提案手法では,まずシーングラフを用いて画像に描画された物体間の関係を抽出し,大規模言語モデル(GPT-3.5)を用いてそれらの関係を画像キャプションに変換する.次に,マルチモーダル大規模言語モデル(GPT-4V)を用いて画像から主要物体を抽出し,併置型駄洒落における種表現とする.次に,GPT-3.5を用いて種表現と母音が類似する単語を生成し,種表現と音韻類似度の高い単語を変形表現として抽出する.最後に,画像キャプション,種表現,変形表現を用いて画像の描画内容に関連する併置型駄洒落を生成する.評価実験では,提案手法を用いてシーングラフが付与された画像100枚中29枚の画像に対して併置型駄洒落候補が生成できた.10名の被験者によるアンケート評価を行った結果,これらの候補の内94%は画像に関連していたが,併置型駄洒落として成立していたのは37%であった.

  • 穴口 史将, 森田 武史
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 05-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    本研究では,ナレッジグラフ推論チャレンジ【実社会版2022】が提供するデータセットを対象として,家庭内危険行動の理由と根拠を提示可能なシステムを提案する.まず,日常生活行動知識グラフから高齢者の家庭内危険行動を抽出する.次に,大規模言語モデル(GPT-3.5)を用いて,その行動が危険である理由を提示する.さらに,高齢者の家庭内事故に関する文献から,RAGを用いてこの理由に類似する文を生成し,検索エンジンの検索結果と共にユーザに根拠として提示する.最後に,根拠オントロジーに基づいて,この根拠の知識グラフを構築する.提案システムが家庭内危険行動の理由を適切に生成できるか,また,この理由に対して提案システムが提示する根拠が適切であるかを評価するために,大学生15名に対してアンケートを実施した.アンケートの5段階評価の平均値は,それぞれ3.6と2.6となった.結果として,提案システムは家庭内危険行動の理由に対する一般的な根拠を示すことができた.次に,提案システムが提示する根拠の正確性を評価した.結果として,検索エンジンが家庭内危険行動の理由に類似する箇所を根拠として検索できることを確認した.

  • 飯島 彩友, 兼岩 憲
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 06-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    ナレッジグラフに対して様々な埋め込みモデルが提案されているが,それはオントロジーからの包含関係などの予測を強化できない.そこで近年,オントロジーの語彙情報を活用したり,論理構造を図形的に解釈して埋め込み学習を行う手法が提案されてきた.しかし,それらの埋め込み手法のほとんどは論理構造といっしょにオントロジーの語彙情報を学習に使用していない.そこで本研究では,オントロジーの語彙情報を取り入れながら論理構造を捉えた埋め込みモデルを提案する.提案手法では,HAKEの階層ラジカル座標によってRotatEの複素埋め込みを拡張しつつ,語彙情報から学習したベクトルで各エンティティの埋め込みを初期化する.評価実験では,ベンチマークオントロジーFoodOn,GO,HeLiSを用いた概念包含の予測タスクにおいて提案手法が既存の手法を上回り,語彙情報と論理構造を同時に考慮することの有効性を示す.

  • 河村 郁江
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 07-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    本研究の目的は、郷土食の継承と理解に資するLinked Open Dataを構築することである。郷土食には地域の特性や文化に関する重要な情報が含まれているが、現代の食生活の変化により、家庭で郷土食を継承する機会が減少している。そこで、郷土食に関するアンケート調査を実施したところ、郷土食を作りたい理由で最も多かったのは「伝承したい」であり、作りたくない理由で最も多かったのは「時間がかかる、面倒、手間がかかる」「材料を揃えるのが大変」であった。これらの結果から、大規模言語モデルを用いて既存のレシピを簡略化し、LOD化することが郷土料理の発信に寄与すると仮説を立て、郷土料理レシピの簡略化システムを構築した。今回は、生成された簡略化レシピに人間の「修正コメント」を活用することで、レシピの精度向上を試みた。また、コメントの効果的な活用方法についても検討した。

  • 三辻 史哉, 澤村 勇輝, 森田 武史
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 08-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    文中の固有表現を知識ベース内のエンティティと対応付けるタスクであるエンティティリンキング(EL: Entity Linking)は,知識処理や自然言語処理の基盤技術として注目されている.既存のEL手法の多くは英語を対象としている.日本語文を翻訳して英語を対象としたEL手法に与えた場合,日本語特有の固有表現抽出に失敗したり,固有表現抽出と語義曖昧性解消の性能が低下することがある.本研究では,代表的な大規模言語モデルであるGPT,Llama 2,Swallowに基づく日本語と英語を対象としたEL手法を提案する.提案手法は大規模言語モデルにプロンプトを与えて,EL対象文からエンティティ名の抽出とそれに対応するWikipedia URLを生成する.次に,WikidataのSPARQLエンドポイントに問い合わせをして,Wikipedia URLからWikidata IDを取得し,エンティティ名とそのWikidata IDを出力する.評価実験では,LC-QuAD2.0,SimpleQuestions,WebQSPの日本語と英語のデータセットを対象に,提案手法と先行研究のEL手法を比較評価した結果を示す.

  • 森 俊人, 森田 武史, 鵜飼 孝典, 江上 周作, 福田 賢一郎
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 09-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    DBpediaは集合知により構築されたWikipediaに基づいているため不完全な知識グラフ(KG)である.KG中の欠損したエンティティや関係を補完するために,KGの埋め込みを用いたKG補完の研究が行われている.既存手法の多くは,学習時に用いるKGに含まれないエンティティ(未知エンティティ)の表現ベクトルが計算できないため,未知エンティティに関するKG補完ができない課題がある.本研究は,Wikipediaの赤リンクから抽出したDBpediaにおける未知エンティティを用いて,DBpediaを拡張することを目的とする.提案手法では,まずWikipediaの記事から赤リンクを抽出し,赤リンクからDBpediaにおける未知エンティティを抽出する.次に,Wikipediaの一覧記事を用いて未知エンティティのクラスを抽出する.さらに,DBpediaオントロジーを用いて未知エンティティのプロパティを抽出する.最後に,大規模言語モデルGPT-4を用いて,未知エンティティのプロパティ値を補完する.評価実験では,DBpediaにおける既知と未知エンティティのプロパティ値補完精度を比較する.

  • 太田 博三
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 10-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    最近のマルチモーダル基盤では,音声・テキスト・画像・音楽を中心としたモーダルで構成されている.アニメのキャラクター生成のように,Text-to-Imageが多く見受けられ,その品質もクリエイターに匹敵しAIクリエイターとして代替しつつある.さらにImage-to-Videoも出てきている.これらはTextを起点としており,社会的に受容されつつある.一方,Image-to-MusicやMusic-to-Imageのモーダル間の試みは少ない.技術的には音声・テキストや画像,音楽などの複数の異なるデータを個別にトークン化し,大規模言語モデル(LLM)として,マルチモーダルの理解と生成を自己回帰的に行うものと捉えられる.ブラックボックス化している原因として,人間の感覚との乖離があり,ナレッジグラフやオントロジーの視点で捉えられるかが重要となっている.本稿では,Image-to-VideoとImage-to-Musicの解釈可能性を考察し,今後の見通しを述べる.

  • 浅野 歴, 森田 武史, 鵜飼 孝典, 江上 周作, 福田 賢一郎
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 11-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    本研究では,駄洒落文スコア,ランダムフォレスト(RF),マルチモーダル大規模言語モデルGPT-4Vを用いて,駄洒落データベース内の併置型駄洒落が入力画像の描画内容に即しているか否かを認識する手法を提案する.提案手法を評価するために,MS COCOの画像と駄洒落データベース内の併置型駄洒落の組に対して,併置型駄洒落が画像の描画内容に即しているか否かを評価し,データセットを構築した.MS COCOの画像3,500枚を対象に,各画像に対し駄洒落文スコアの高い上位5件の駄洒落を分析した結果,駄洒落文スコアを算出するために提案したどの指標も駄洒落文認識に寄与していた.構築したデータセットを対象に,RFとGPT-4Vを用いた手法を評価した.RFを用いた手法の正解率は0.949となり,描画内容に即していない併置型駄洒落文は高精度に認識できた.GPT-4Vを用いた手法は,適合率,再現率,F値において,RFを用いた手法の精度を上回った.しかし,RFとGPT-4Vを用いた手法の再現率はそれぞれ0.127,0.280と低く,さらなる認識精度の改善が必要であることが明らかとなった.

  • 南條 圭亮, 安居 優仁, 重谷 史弥, 竹内 和広
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 12-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    Wikipediaに代表される百科事典的な知識の解説文書が電子化され利用可能となっている。これらの知識の解説文書は、急速に普及した大規模言語モデルの学習データとしてもよく利用されている。解説文書中のテキストの内容から知識グラフを抽出・整理することは、自然言語処理ツールを効果的に利用することで効率化が期待できる。しかし、知識記述の対象領域には違いがあり、対象領域に応じて知識グラフ抽出のためのアルゴリズムを調整することは容易ではない。そこで本発表では、知識記述の対象領域に応じて、特定の要件や特性に合わせてカスタマイズ可能な、知識抽出のための汎用的な自然言語処理インタフェースを提案する。具体的には、Wikipediaの説明テキストを基準とし、独立行政法人労働政策研究・研修機構が整理する職業情報データベースの職務記述テキストを対象に、提案手法の有効性を検討する。

  • 古崎 晃司, 江上 周作, 松下 京群, 鵜飼 孝典, 川村 隆浩, 福田 賢一郎
    原稿種別: 研究会資料
    2024 年 2023 巻 SWO-062 号 p. 13-
    発行日: 2024/03/23
    公開日: 2024/03/30
    研究報告書・技術報告書 フリー

    While the use of generative AI is attracting considerable attention, employing large-scale language models (LLMs) has emerged as one of the most significant issues in the field of knowledge engineering. In the application of LLMs, the ability to explain the generated content represents a critical challenge. This challenge is shared with the Knowledge Graph Reasoning Challenge, on which the authors have been focusing. Against this backdrop, we have designated the construction of knowledge graphs using LLMs as the task for the Knowledge Graph Reasoning Challenge 2023. This paper offers an overview of the event and its outcomes.

feedback
Top