抄録
代謝物データベースとして公開されているKNApSAcK Core DBから50,037件の二次代謝物の分子構造データを取得した。COMPLIGによる構造類似度95%を基準に177,179の代謝物ペアを選択した。さらに機能未知の代謝物どうしのペアを取り除いて22,482の代謝物ペアを選択した。このデータからは10,773のノードを22,482のエッジでつないだネットワークが構築された。グラフ・クラスタリング・アルゴリズムであるDPClusOを用いて代謝物ネットワークから8,047の代謝物クラスタを抽出し、構造と生物活性の関係を検討した。