医薬基盤・健康・栄養研究所他研究機関での食品統計調査の支援を意図し、国民の検討栄養調査の食品群からOWLで食品オントロジーFGNHNSを構築しBioPortalで公開した。さらなる拡張としてWikidata情報の追加、FoodOnとの連携、日本標準食品成分表との統合、農作物語彙体系との連携、食物アレルギー情報との連携をすすめている。本研究会でその状況を報告する。
Wikidata, one of the largest knowledge graphs curated by the worldwide community, has been growing enormously over the years, leading to many concerns about data quality issues. Much factual knowledge of Wikidata lacks references information or insufficient information to support other fact- checking applications. In this paper, we first analyze the provenance status of researchers of Wikidata as a topical Wikidata domain knowledge. Second, we propose a new evaluation method to judge the provenance information of the target domain. Using our new evaluation methods, we found many references in the researcher domain inaccessible or difficult to access.
個人の知識や記憶を表現する個人知識グラフは,その個人にしかわからないエンティティのみで構成されるため,自動的に構築することが難しいと言われている.本研究では,個人が作成したデータから,当該人物の知識や記憶を抽出できる可能性があるという仮説の下,データに名前を付けながら管理するファイルシステムに着目し,個人のファイルシステムから個人知識グラフを構築する手法を提案する.提案手法では,フォルダ名,ファイル名,およびファイル内のテキストから知識とは関係ない文字列を除外しつつ,個人の知識を示す文字列を抽出し,ファイルシステム上の親子関係を基に,エンティティ間の関係を推定する.また,提案手法の性能を,ユーザ実験により評価した.
Causal relation knowledge is necessary to develop a facilitator agent that can understand discussion points and participants' opinions. However, it is not enough to be included in the Knowledge Graph. In this study, we attempted to extend the training data using Wikidata's casual relation knowledge as a method for extracting causes. To compare whether the proposed extraction method is more accurate than previous methods, we compared the accuracy of the output causes by inputting sentences. In addition, a calculation method was examined to determine if the extracted causes could be considered a general causal relationship. As a result, the accuracy of the extraction is improved over conventional methods, and a threshold value can be determined to consider it as a general causal relation. Future work includes the development of a facilitator agent to support discussions using the methods in this paper.
本研究の目的は,がん治療の副作用による生活上の問題点を感じているがんサバイバーの生活改善を支援するために,問題を解決する生活の知恵を知識モデルとして記述し,患者同士が生活の知恵を共有・活用できるシステムを開発することである.文献や患者インタビューの分析結果に基づいて,行為分解木というオントロジカルな枠組みを援用して,投薬から症状の発現,症状から日常生活における問題点と,それに対する対処方法を,原因—結果の因果連鎖として構造化し,対処方法を分類して,知識モデルとして記述した.記述した知識モデルに基づいて,患者がWebブラウザ上で生活上の問題点から対処方法を閲覧・共有できる知識共有システムのプロトタイプを開発した.本稿では設計思想,プロトタイプの機能と動作などについて報告する.
近年,ビルディングオートメーションシステム(BAS)やファクトリーオートメーション(FA)の分野でデジタルツインが台頭している.実空間の情報をデジタル空間で再現し,制御・管理を最適化することが期待されている.一方,制御・管理の各パラダイムにおける物理資産のデータ管理には,データモデルの不均一性やサイロ化などの問題がある.これらの問題を解決するために,セマンティクスを活用したデータモデリングが注目されている.本研究では,屋内空間向けのデジタルツインを表現するためのオントロジーを提案し,評価を行った.
本報告は,近年のインターネットのWeb技術の進展とともに情報のビッグデータ化やオープンデータ化が進み、収集したデータをDBpediaやWikidataなどと連携させる地域情報支援システムの構成について述べる。現状のインターネットサイトのデータベースは高度化してセマンティック化し、知識ベースとして構成されつつあり、検索などに活用されるとともに関連する多様な情報も提供できるようになっている。本システムでは、東京都渋谷区千駄ヶ谷町地域の各種施設、オフィスや商店などの情報を収集し、これらを主語、述語、目的語の三つ組として構成し、RDF(Resource Description Framework)データに変換する。さらに、DBpediaなどに掲載されている情報との連携を図り、ユーザが希望する観光などの情報提供を支援する。
2022年からナレッジグラフ推論チャレンジ【実社会版】(実社会版チャレンジ)が,高齢者の家庭内における安全性をテーマにして開催されている.実社会版チャレンジでは,危険な状況を提供されるデータから検出し,その理由を説明,さらにより安全な代替案を示すメインタスクと,生活行動ナレッジグラフの生成と危険な状況の定量的な評価の2つのサブタスクが設定されている.本稿では,本チャレンジで提供しているデータと同様の高齢者の日常生活を表現するデータの生成を支援するツールと,動画とナレッジグラフを対応させて可視化し,動画とナレッジグラフの両方を組み合わせて転倒リスクの検知ができるように支援するツールが提供する機能について述べる.
時間とともに変化する情報に対して、何が変化したのかを人が理解しやすいように、意味的なまとまりで抽出し要約する手法について述べる。具体的にはCTD(Comparative Toxicogenomics Database)を例にして、CSVでの差分の抽出や、バージョン情報を伴ういくつかのKG表現・差分抽出・要約について述べる。また法令への適用についても言及する。
ナレッジグラフ推論チャレンジ【実社会版】のタスクの一つが、ナレッジグラフで表現された生活における短いシーンに潜む危険をみつけることである。そこで本発表では、日常生活ナレッジグラフ中のイベントに対するラベリングを埋め込みを利用して行い、埋め込みによる違いを検討する。
シーングラフ生成(Scene Graph Generatione:SGG)は大規模なデータセットのリリースにより研究が活発になり、大きく進歩している.しかし現在のデータセットはロングテール問題やground-truthの質自体に問題を抱えており、SGGの精度に大きく影響を与えているのが現状である.本研究では、VirtualHomeを用いて、アバターが多様なアクション行っている動画のデータセットを生成し、どのようなデータセットがSGGの精度を向上させるのか、または低下させるのか限界を調査することが目的である.今回はアバターと対象となるオブジェクトと関係を表している述語のラベルの分布、特にアクションのラベルの分布が異なるデータセットを作成し調査を行う.
データサイロの問題の解決に必ずしも標準化は必要ではなく、データの構造や形式を必要に応じて自動変換することで対応が可能である。データを取り扱うシステムがこの自動変換機能を備えるとき、データの本質的でない詳細は隠蔽されるのでデータの意味に応じた階層的な分類が可能となる。このとき、上位の分類名やデータ間の関係の名称には既共有の自然言語を使うのが妥当と考えられる。本研究では、自動変換機能を前提として、断片的に与えられる自然言語類似の情報表現をナレッジグラフとして統合する手法を検討する。