コンピュータ ソフトウェア
Print ISSN : 0289-6540
連続データに柔軟な大規模計算基盤
水谷 后宏間野 暢明石 修福田 健介
著者情報
ジャーナル フリー

2013 年 30 巻 2 号 p. 2_101-2_118

詳細
抄録

近年,時系列データや地理位置データといった連続データの管理・解析手法が注目を浴びている.これらの連続データは,分散環境上で膨大に生成されることが想定され,オーバレイネットワークなどに代表される分散ストレージ上で管理されるようになった.一方で,蓄積した連続データを解析する手法としてMapReduceを用いた手法が提案されている.しかし,分散ストレージ上の連続データに対してMapReduce処理を行う際,データの連続性や局所性により,特定のノード(計算機)に偏ってReduce処理が割り当てられ,Shuffle処理にて膨大なトラヒックが発生することがある.また,刻々と蓄積されていく連続データに対して,MapReduce処理の同期をとることも難しい.
本提案基盤は,連続データに対して非同期かつ,並列性の高いMapReduce処理を達成する.具体的には,分散ストレージに対してSkipListを改良した平衡木構造を適用し,ノード間で親子関係を構築させる.構築した親子関係を用いて,各ノードが自身の子ノードのShuffle処理やReduce処理の結果を集約したり,Map処理とReduce処理の同期,および生存管理を行うことで,MapReduce処理の同期を細分化する.さらに,木構造の特性を生かし,各ノードの負荷情報を集約し,ノード間の負荷を均一にする.これにより,各ノードの計算量を平滑化できるためMapReduce処理の並列性を向上させる.

著者関連情報
© 2013 日本ソフトウェア科学会
前の記事 次の記事
feedback
Top