応用統計学
Online ISSN : 1883-8081
Print ISSN : 0285-0370
ISSN-L : 0285-0370
研究論文
区間値関数データに対する主成分分析法の提案
池田 智康小宮 由里子南 弘征水田 正弘
著者情報
ジャーナル オープンアクセス

2010 年 39 巻 1 号 p. 21-33

詳細
抄録

本研究では,関数主成分分析のシンボリックデータ解析への拡張を扱う.
シンボリックデータ解析とは,Didayによって提唱された,データへの新しいアプローチである(Bock and Diday 2000, Billard and Diday 2006).シンボリックデータ解析において,観測値は多値データや区間値データ,モダルデータとして表現され,これらを総称して“シンボリックコンセプト”と呼ぶ.このような様々なデータ表現を用いることで,解析対象である抽象的なコンセプトをより柔軟に表現し,適切なデータ解析を行える利点がある.またシンボリックデータ解析を応用することで,従来の統計的解析方法では扱いにくかった膨大かつ複雑なデータを効率的に解析することができる.シンボリックデータ解析における代表的な手法として区間値データへの主成分分析の適用方法が研究されている.
多様なデータセットに対する別のアプローチとして,Ramsayらが提唱した関数データ解析がある(Ramsay and Silverman 2005).関数データ解析では,データをベクトルや行列ではなく実関数として表現し,これら関数を直接解析するアプローチである.仮に観測値が連続的な変化など関数構造をもつ場合,関数データ解析を応用することで,より適切な解析を行うことができる.
本論文では,関数データをシンボリックデータ解析の枠組みへ拡張し,上限関数と下限関数という2つの関数からなる“区間値関数データ”というデータタイプを提案する.そして,このデータに対する主成分分析法,つまり区間値関数主成分分析法について述べる.また,この提案手法を気温データに適用した例を述べ,その結果を考察する.

著者関連情報
© 2010 応用統計学会
前の記事
feedback
Top