人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 3Xin4-74
会議情報

分散データに対する統合的なクラスタリングの提案
自治体住民のライフスタイルデータを題材に
*紀平 真輝河又 裕士管原 侑希櫻井 瑛一本村 陽一今倉 暁櫻井 鉄也塚尾 晶子久野 譜也岡田 幸彦
著者情報
会議録・要旨集 フリー

詳細
抄録

近年、機械学習や統計解析、さらには因果推論を目的として、生データを共有せずに統合的な解析を行うことができるデータコラボレーション(DC)解析に関する研究が盛んにおこなわれている。本研究は、新たな応用技術としてDCクラスタリングを提案する。自治体住民のライフスタイルアンケートを用いた技術評価では、先行研究で用いられた自治体内に実在する11のコミュニティのいずれかに属する住民のデータ(n=2763)に対して、以下の3種類のクラスタリングを行う。(1)自治体住民全員の生データを共有した集中クラスタリング、(2)コミュニティを超えて生データを共有できないことを想定した個別クラスタリング、(3)生データを次元削減したデータを共有したDCクラスタリング、の3つの方法を実施し、それぞれのクラスタリングによる分類精度を検証する。本研究の技術評価の結果、我々が提案する(3)は明らかに(2)よりも分類精度を向上させるとともに、(1)と同程度の分類精度を実現できた。したがって、DCクラスタリングは、プライバシーを保護した上で、分散データによるクラスタリングを行う際の有用なアプローチとして期待される。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top