空間上のさまざまな地点で得られた多変量の経時測定データを利用して,未観測地点を含めた特徴の曲線をクラスタリングする方法を提案する.観測されている経時測定データに対して滑らかな関数を当てはめることで関数データとして扱い,関数データに対するクリギングを適用することで未観測地点の特徴を関数として予測する.さらに,観測地点における関数データと,未観測地点における関数データの予測値に対してクラスタリングを適用し,クラスターおよびクラスター数を決定する.この方法により,データが観測されていない任意の地点において,観測された経時データの空間上の相関を考慮に入れてデータの推移を予測し,その類似性に基づいてクラスタリングを行うことができるため,より詳細な領域の分割が可能になる.提案手法の有効性を,数値実験および実データの分析を通して検証する.
本研究で扱う顧客購買行動は実務家と研究者の双方にとって関心の高い事象であるが,それを構成する主要な 2要素である購買間隔と購買金額はこれまで別個に取り扱われてきた経緯が存在する.一方,実際の購買行動の傾向を考慮すると,本来それらは同時にモデリングされるのが望ましい.従って本研究では,確率過程の一種であるマーク付き Hawkes過程をスーパーマーケットにおける顧客購買行動の文脈に適用することで,過去の全ての購買行動を加味しつつ,購買時刻と購買金額に関する同時メカニズムを確率的に推定する手法を提案する.顧客ごとの異質性や性年代等の共変量をモデルに組み込んだ上で,EMアルゴリズムを用いて推定を行った結果,いくつかの実務的に重要な示唆を得ることができた.また,シミュレーションの結果,従来的なモデルに比べて本稿で提案したマーク付き Hawkes過程が極めて高い予測力を有することが明らかになった.
新たな価値の創造を目的とした独創的なシステムの提案・構築には,シンセシスを基盤とした科学技術の構造が必須であり,いわば能動的ともいえる研究スタイルが必要となる.データサイエンスや AIの未来に関し,知能システムの基本構造から,その課題を述べ,未来を考える.