ケモインフォマティクス討論会予稿集
最新号
選択された号の論文の17件中1~17を表示しています
プログラム
口頭発表
  • アルガ マンガラ, 杉本 学
    p. 1A01-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    電子状態計算で求めた記述子を用いて、フェノール誘導体の環境毒性に関する作用機序の分類と回帰を行なった結果を報告する。
  • 沼田 康平, 田中 健一, 船津 公人
    p. 1A02-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    材料開発や医薬品開発の現場では、大量の候補から目的の物性・活性を満たす化合物を探索する。ここで、金銭的・時間的コストの改善を目的として、実験回数の低減が求められている。機械学習による予測モデルを活用して実験回数の低減を実現する方法として、Sequential Model-Based Optimization (SMBO) が存在する。モデルとして用いられる既存手法は外挿の予測に適していない一方で、化合物探索においては、既存のデータから離れた物性・性能を達成するために外挿性が求められる。そこで本研究では、外挿に対応可能な非線形回帰手法、Stochastic Threshold Model Trees (STMT) を提案し、SMBOに適用することで効率的な化合物探索を目指した。STMTに対して新たな獲得関数を適用することで、検証に用いたデータセットについて、その探索性能が既存手法よりも優れていることを示した。また、各手法の探索過程について可視化を行い、提案手法が効率的な探索を行えることを確認した。
  • 長島 大, 畑尾 卓也
    p. 1A03-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    代表的な熱硬化性樹脂のひとつであるエポキシ樹脂について、全原子分子動力学計算と機械学習により機械・熱特性に関する構造-物性相関解析を行った。熱硬化性樹脂の物性は架橋反応によって形成される高次構造に大きく依存するため、プレポリマーの分子構造だけではなく高次構造を加味して物性との相関を明らかにする必要がある。本検討では原料分子記述子に基づく物性相関解析に加え、パーシステントホモロジーをはじめとするトポロジーデータ解析(TDA)手法を用いた高次構造-物性相関解析ならびに分子記述子-高次構造相関解析を行った。TDAにより高次構造を適切に取り扱い、階層的な依存関係を機械学習モデルによって接続することで予測精度と現象理解の両立を図ることができた。
  • 佐藤 彰准, 宮尾 知幸, 船津 公人
    p. 1A04-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    定量的構造活性相関(QSAR)と定量的構造物性相関(QSPR)モデルは、化学構造から生物活性や分子物性を定量的に予測する。通常、分子構造のトポロジカル情報が利用されている(2次元分子表現、2D記述子)。しかし、分子は三次元空間に存在するため、構造情報が重要であると考えられる。多様な化合物に適用可能な3次元分子表現(3D記述子)として、被験分子と参照分子との類似性を示す方法が提案されている。本研究では、この3D記述子をQSAR/QSPRモデリング(回帰タスク)に導入した。さらに、3D記述子の2D記述子と比較し、訓練データの多様性の観点から、3D記述子のメリットを検討した。その結果、量子力学に基づく物性予測では、3D記述子の方が2D記述子よりも優れていることがわかった。また、特定の生物学的標的に対する低分子の活性を予測する課題では、訓練データやテストデータの多様性に関わらず、2種類の表現法による性能の差に一貫した傾向は見られなかった。
  • 中原 真希, 向田 志保, 岩壁 幸市
    p. 1A05-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    機械学習を活用した化合物構造の最適化では、高精度なモデルを構築・予測することに加えモデルから材料開発に適用できる新たな知見を得ることも重要である。これまでに、ディープラーニングを用いて化合物の予測根拠を可視化する手法が報告されているが、ディープラーニングでの解析が困難な少数データにも適用できる手法の開発も求められている。本発表では、記述子にフィンガープリントを用いた機械学習モデルから、各部分構造の寄与を部分構造の広がりを考慮した上で統合し、ターゲット分子上に可視化する手法を提案する。また、公開データに対して提案手法を適用し、既知の化学的知見と比較して妥当な予測根拠が得られたことを示す。さらに、提案手法を共重合体の最適化に用いた結果を報告する。
  • 陳 嘉修, 小林 岳史, 中西 恒平, 廣田 剛, 和泉谷 勇太, 大崎 浩二, 金谷 重彦, 小野 直亮
    p. 1A06-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    本研究では、2つの異なるニューラルネットワークモデルを構築しました。一つは、一連の触媒画像から触媒の品質を予測するための畳み込みニューラルネットワークモデルです。もう一つは、ポリエステルのガラス転移温度(Tg)を予測するためのグラフ畳み込みニューラルネットワークモデルである。さらに、勾配ベースの手法を適用して、可視化を行いました。どのナノ構造や化学構造が性能に影響を与えるかを理解しました。今回トライした「勾配ベースのアプローチ」は、構造特性評価タスクに対してはるかに効果的であり、材料の設計と開発に必要な時間とコストの両方を節約することができます。
  • 黒﨑 宏太, 佐々木 俊一, 松坂 恭成, 植沢 芳広
    p. 1A07-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    現在、約13,000化合物に対するAmes試験データを対象としたThe 2nd AMES/QSAR International Challenge Projectが開催されている。本研究は、このAmes試験データを用いたQSAR解析による予測ベンチマークの提示を目的とした。我々は、分子グラフからEnd to End学習により特徴抽出を行うGraph Neural Network、及び化学構造記述子に基づいた機械学習モデル(LightGBM, XGBoost, Neural Network)を用いてQSAR識別モデルを構築した。本研究におけるモデル化スキームとして各モデルの予測値を統合するStacking ensemble法を導入した。本法は、異なる分類器及び分子構造の入力表現を組み合わせることで、予測精度の向上を図れることに動機づけられている。化学構造記述子に基づいた機械学習及びGNNともに良好な予測パフォーマンスを示すモデルを構築することに成功した。これらのモデルのStackingモデルでは予測精度のさらなる向上が確認された。本研究で得られた知見は、変異原性データベースに対するQSARモデルのベンチマークとすることが可能である。
  • 仲吉 朝希, 加藤 紘一, 小柳津 良太, 野田 奈津子, 栗本 英治, 小田 彰史
    p. 1A08-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    現在存在する生物の持つタンパク質は、約20種類のアミノ酸から構成されている。しかし生命の最初期のタンパク質は約20種類すべてを持っていたとは考えにくく、限られた種類のアミノ酸のみから作られていたと考えられることが多い。多くの場合Gly, Ala, Asp, Valの4つが原始タンパク質構成アミノ酸と考えられることが多いが、本研究では「5番目」のアミノ酸としてGluを加えた場合の影響について検討した。方法としては、これらアミノ酸をランダムに20残基並べたペプチドについてMDシミュレーションで立体構造を推定した。その結果ランダムペプチドが何らかの立体構造をとる傾向がGluを入れることで増強されることがわかった。
  • 西川 大貴, 田中 健一, 船津 公人
    p. 1A09-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    リチウムイオン電池は、持続可能なエネルギー資源として多くの問題を抱えており、ポストリチウムイオン電池の開発が急務となっている。電池材料の開発においては、第一原理計算に代わって、機械学習モデルを利用したより効率的な材料探索が注目されている。正極材料についても、組成式からインタカレーション型正極の平均電圧を予測するモデルが提案された。一方で、スクリーニングへの適応を考慮すると、組成式から詳細な物性評価に繋げにくい点やモデルの適応範囲を簡単に評価できない点などの問題がある。本研究では、先行研究の問題点を踏まえ、結晶構造を入力として扱い、予測の信頼度も評価できる平均電圧予測モデルを構築した。既往手法との比較の結果、精度を維持しつつ、モデルの課題点を克服することができた。今後は、構築したモデルを利用して、ナトリウムイオン電池の正極材料のスクリーニングを行う予定である。
  • 清野 淳司, 中井 浩巳
    p. 1A10-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    我々はこれまでに、ニューラルネットワークに基づくバッチ型機械学習により、電子密度情報とエネルギー密度を繋ぐことで、密度汎関数理論(DFT)の概念に基づく高精度なエネルギー密度を予測する手法を開発してきた。本発表では、汎用性を向上させるため、つまりあらゆる分子系のエネルギー密度を高精度に予測できる手法とするために、電子/エネルギー密度データベースからの膨大なデータを常に学習し続けるオンライン機械学習に基づくエネルギー密度予測システムを開発した。オンライン学習型Extreme Learning Machineに基づく本手法により、これまでは困難であった、任意の化合物に対して高精度に運動/相関エネルギーを表現できる汎関数の獲得が実現可能であることが示唆された。
  • Md. Althaf Hussain, Kazuki Yoshida, Takafumi Inoue, Manabu Sugimoto
    p. 1A11-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    量子化学計算で計算した記述子を用いて、ペロブスカイト太陽電池用のフタロシアニン系ホール輸送材料のホール輸送特性に関する機械学習を行い、回帰モデルを求めた。またそれを用いて分子設計指針を明らかにした。
  • 井上 貴央, 田中 健一, 船津 公人
    p. 1A12-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    創薬や材料開発では, 所望の性質を持つ新規有機分子の効率的な探索手法が求められている. 定量的構造物性相関モデルとしてグラフニューラルネットワーク (GNN) と呼ばれる深層モデルを用いることで, 既存の特徴抽出手法を用いるよりも良い予測性能で, 候補構造のバーチャルスクリーニングができる. しかし, 先行研究では学習に多量の化学構造データを利用しており, 興味のある構造・物性データが多量に集まりにくい分子設計の現場では, 十分な予測性能が得られない可能性がある. 本研究では, Message Passing Neural Network (MPNN) と呼ばれるGNNモデルの中で特徴ベクトルに摂動を加えることでグラフデータの拡張を行うPerturbating MPNN (PMPNN) を設計した. QM9データセットでMPNNとの比較を行い, 提案手法の有効性を検証し, 予測に対する摂動の効果を考察した. また, データ拡張により約半数のデータセットでも元と同等の予測性能が得られ, 少量のグラフデータでもうまく特徴抽出できると示唆された.
  • 佐藤 稔也, 清野 淳司, 中井 浩巳
    p. 1A13-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    遷移金属錯体における形式酸化数は、幾何構造の推定や均一系触媒の反応性の理解、酸化還元特性の理解などのために頻繁に用いられる。一方、量子化学計算による電荷は、個々の原子の電子状態を解析するために用いられるが、様々な効果が複合されるため、形式酸化数とはしばしば定性的に異なる挙動を示す。そこで本研究では、量子化学計算に基づき形式酸化数を解釈し、電荷との関係を明らかにすることで、電荷から派生する種々の効果に分割する手法を提案する。その結果、本定義により算出した形式酸化数はIUPACの定義による形式酸化数を完全に再現すること、電荷を酸化数・結合成分・残留成分の異なる挙動を示す成分に分割できることがわかった。それぞれの成分は反応性解析への応用や機械学習における新たな記述子として用いることが期待できる。
  • 若杉 昌輝, 金子 寛, 川﨑 惇史, 西端 芳彦
    p. 1A14-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    創薬段階でのコンピュータを用いた候補化合物のデザインにおいて、合成容易性の考慮は重要である。しかし、既存の予測手法ではうまく評価できない化合物が報告されており、機械学習を用いる、より網羅的な予測手法の構築を目指した。CICSJ42において、深層学習による予測モデルが40化合物の検証セットを合成が困難な化合物群と合成が中程度〜容易な化合物群に判別できることを報告した。しかし、合成容易性が中程度の化合物と容易な化合物をうまく判別することはできなかった。今回、トレーニングセットの化合物数や隠れ層のノード数を増やし、合成難易度が中程度の化合物に対する合成容易性評価の精度が果然されるかどうかを検証した。テストセットの判別に対しては、以前の予測モデル(99.08%)よりも高い正答率(99.32%)を有する予測モデルが得られたが、検証セット中の合成容易性が中程度の化合物に対しては、明確な改善は得られなかった。現在、予測モデル出力の解釈手法についてさらに検討を行っている。
  • 山口 徹, 山田 秀尚, 堀 憲次
    p. 1A15-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    理論計算による遷移状態解析結果を、反応速度論に適用し、詳細な反応プロフィールを追跡シミュレーションすれば、反応器設計等に役立つと考えられる。しかしながら、複数の基質を共有し、相互に作用し合う複数の反応が混在している系でシミュレーションを試みた場合、その計算コストが膨大となる問題がある。本研究では、Eyringの絶対反応速度論式を基に、複雑系の反応速度論式を、連立常微分方程式により解く方法を提案した。またこれを、反応速度論シミュレーターKineratorに、Python3を用いて実装した。TSDBに収録されている安息香酸の無水化反応(4段階で進行)の活性化Gibbs自由エネルギー及び、反応Gibbs自由エネルギーを用いて、Kineratorによりシミュレーションを実施し、時間における基質の濃度変化を追跡した結果を示す。
  • 前山 恵璃, 山口 徹, 隅本 倫徳, 堀 憲次
    p. 1A16-
    発行日: 2020年
    公開日: 2020/11/29
    会議録・要旨集 フリー
    これまで機能性化学品の合成経路の開発は、経験に富んだ合成化学者の経験や勘に大きく頼ってきた。目的生成物が複雑な構造を持つ場合、多くの合成経路が考えられ、どの合成経路が効率的であるかについての判断は困難であることが多い。我々は、置換基を多数有する分子における反応に対しては、TSDBから選択された類似反応のTS構造を利用して、対象とする反応のTS構造を得る方法を提案してきた。しかしながらこの方法は、最安定なTS構造を与えないことが多い。即ち、最適化された遷移状態(TS)、反応物および生成物の安定性は、最適化に用いた初期構造に大きく依存する。そのため、この方法は、複数の合成反応の有用性や実測値と比較するには不十分なデータを与える可能性が高い。これらの目的には、反応に関係する分子の最安定配座の探索が必要とされる。本研究では、最安定配座を探索する手法を提案するとともに、1-phenylbutane-1,3-dioneと ethanimidamideのPinner Pyrimidine反応に適用した結果を示す。
feedback
Top