抄録
データ可視化プロセスにおいては、高次元空間内に分布しているデータを低次元へ写像することにより、データの特徴を把握する。本研究では、Generative Topographic Mapping (GTM) を利用した最適なマップ構築をするために、GTMにおけるハイパーパラメータを最適化する新規指標を検討した。GTMとは、確率分布を利用した非線形次元削減手法である。GTMに用いられるハイパーパラメタ最適化のために、誤差の二乗平均平方根(RMSE)を利用することが多いが、今回、写像の滑らかさを評価するため中点RMSEと最近傍探索の組み合わせを利用した指標を提案した。提案した指標の有効性を検討するため、ケーススタディとしてシミュレーションデータを用いた解析、仮想プラント(Tennessee Eastman Process)シュミレータにより作成したデータを用いた解析を行った。結果、提案指標により構築したマップが、最も信頼性が高いデータ可視化となることを確認した。