日本国の医療機関ではITシステムが広く利用されており,医療情報が急増するとともにその利活用が課題となっている.医療情報の利活用に必要な要件として「大規模データ処理」が挙げられる.大規模データ処理には,①様々な医療機関からのデータの収集と保存,②永続的に増加するデータの利活用を可能にするシステム拡張性の確保,③大量データ処理のためのセキュリティ確保,が必要である.
これらの要件を考慮し,キーバリュー・ストア型データベースCassandraおよび分散処理システムHadoopを活用したクラウドシステムのアーキテクチャを設計,構築した.Cassandraを用いることで,検索性能は,データ量増大による速度低下を押さえつつ,既存RDBMSと比較して充分な性能を示した.また,初期構築コストもデータ容量拡張性を確保しつつ,約63%~66%削減することができた.
大規模データ処理において従来よりも高い持続可能性を持つアーキテクチャを実現したので報告する.
抄録全体を表示