抄録
グラフ構造を持つデータに関する機械学習・データマイニングの研究は、2000年ごろから活発になり、グラフカーネルや、頻出部分グラフマイニングなどの方法が提案された。そのような手法の評価は、データマイニングの会議ECMLPKDD2001で行われたPredictive Toxicology Challengeのデータセットが、広く出回ったことから、有機化合物に対して行われることが多かった。しかし、このような手法は、主に計算機科学のジャーナルや、国際会議で発表されたため、化学・創薬研究者の目に触れることが少なく、今日まで広く使われているとは言い難い状況である。本稿では、主にグラフマイニングに関して述べる。