統一されていないデータ構造は情報抽出プロセスやデータ統合によるバイオインフォマティクス(生薬情報)の著しい妨げとなっている。ここで重要な問題は開発のための標準化である。本稿ではバイオ情報ベースを提供するプロジェクトにおいて、XMLに基づいたプラットフォームの枠組みを提案する。この提案は次に述べる機能を備えている。
(1)データフォーマット変換ツールを用いて、異種の様々な生物学的なデータソースをデータ変換し、独立したデータベースファイルとして直接データウェアハウスにロードすることができる。それを実現するためには、様々なデータソースを統一したデータとして、リレーショナルデータベースのデータに変換することである。
(2)現在のデータソースから行うには、対応するエントリに、同様または別のデータベースに特定の関係をデータエントリ内のエントリにチェックアウトすることが可能である。
(3)データ統合では、垂直統合と水平統合の方法を用いている。垂直統合では、データソースの優先度や信頼に基づいて優先度を決定している。水平統合では、データを統合するにあたって補完性の規則を採用している。
抄録全体を表示