計算機統計学
Online ISSN : 2189-9789
Print ISSN : 0914-8930
ISSN-L : 0914-8930
原著論文
変数サブセットでのオブジェクト間距離と位相的データ解析による医薬品マッピング
北西 由武石岡 文生飯塚 誠也栗原 考次
著者情報
ジャーナル フリー

2022 年 35 巻 2 号 p. 49-67

詳細
抄録

  分類や可視化は, ビッグデータ解析の初手として重要であり, クラスタリングはその代表的な手法である. しかしながら, 従来の一般的なクラスタリング手法では, 全ての変数 (属性) 情報を均等に扱うため, ノイズに攪乱され, 真の構造が見えづらい. さらにデータの特徴を空間的に捉えることと共に, データの更新と増加に対してロバストに可視化することも課題である. これらの課題を解決するために, 変数情報をサブセットで捉えて距離行列を算出するCOSA (Clustering Objects on Subsets of Attributes) アルゴリズム, そして, 複雑なデータ構造を形状として可視化する位相的データ解析マッパー (TDA Mapper : Topological Data Analysis Mapper) を組み合わせた手法を提案する. さらに, アヤメデータをベースにした拡張データでその有効性を検証し, 医薬品データのマッピングへの応用を提案する.

著者関連情報
© 2022 日本計算機統計学会
前の記事 次の記事
feedback
Top