ケモインフォマティクス討論会予稿集
第42回ケモインフォマティクス討論会 東京
選択された号の論文の59件中1~50を表示しています
プログラム
一般公演(A公演)
  • 吉村 誠慶, 松尾 司, 畑中 美穂
    p. 1A01-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    炭素–ケイ素間に三重結合を持つシリンの合成を目的として、かさ高い立体保護基 (Rind 基: octa-R-substituted s-hydrindacene;EMind 基)を有するハーフペアレント型ジアゾメタン (EMind)CHN2 が期待されている。ジアゾメタン類は光による脱窒素によって反応性の高いカルベンを生成するため、反応をいかに制御するかがシリン合成の鍵となる。本研究ではハーフペアレント型ジアゾメタンの光反応について密度汎関数(DFT)法と時間依存密度汎関数法 (TD-DFT)法を用いて反応経路の調査を行った。最初にフェニルジアゾメタン(PhHCN2)をモデル分子として用い、反応経路自動探索法として提案されている人工力誘起反応(AFIR)法を用いて基底状態の反応経路探索を行った。次に TD-DFT法を用いてジアゾメタンの光励起に関与する分子軌道の解析を行った。また、円錐交差や交換交差のように二つのポテンシャルエネルギー面が交差する点の探索法についても紹介する。
  • 五十幡 康弘, 橳嶋 拓朗, 清野 淳司, 吉川 武司, 藤澤 遼, 中井 浩巳
    p. 1A02-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    我々は、電子相関を高精度かつ低コストに扱う手法を開発するためにインフォマティクス技術に注目し、機械学習型電子相関モデルを構築した。このモデルは結合クラスター理論の完全基底極限 (CBS) における相関エネルギー密度を目的変数とする。目的変数を得るために、当研究室で開発されたグリッドエネルギー密度解析および複合法によるCBS極限の見積りを活用した。記述子には、密度汎関数理論 (DFT) における相関汎関数と同様に電子密度や密度勾配などを用いた。機械学習の手法として多層ニューラルネットワークを採用した。数値検証の結果、我々の相関モデルは比較的小規模な基底関数で高精度な電子相関エネルギーを再現することがわかった。さらに、Hartree−FockエネルギーのCBS極限と組み合わせることで化学反応における反応エネルギーを計算し、DFT計算を凌駕する精度を確認した。
  • 田中 大輔, 脇谷 拓真, 鎌倉 吉伸
    p. 1A03-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    金属イオンと架橋配位子からなる、金属-有機構造体(MOF)は、その優れた細孔特性から現在高い注目を集めている。MOF結晶を低次元無機半導体の集積構造と見做せば、単なる無機構造の凝集では実現困難な高度な自己組織化構造が達成可能であるため、優れた光物性やキャリア移動度の実現が期待できる。もし、無機半導体の部分構造を自在に導入したMOFが実現できれば、半導体ナノ構造に由来する優れた光物性に由来する新規電子材料が実現できると期待できる。しかしながら、多様な光物性を示す重元素半導体無機半導体構造を節に持つMOFの汎用的な合成法は存在せず、全く新しい合成戦略の確立が必要である。本発表では、我々のグループが合成に成功した高次元クラスター構造を骨格中に持つMOFの構造と電子物性を報告し、従来合成が困難であった低次元半導体を節に持つ難結晶性MOFの合成条件探索を、機械学習によって効率化する手法について提案する。
  • 柴山 翔二郎, 船津 公人
    p. 2A01-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    機能性ポリマーの新しい構造を実験で探索するのには限界がある。そこでケモインフォマティクスを利用して材料設計を行うが、新規材料の原料は市販されていないことが多く一般にデータが少ない。本研究ではポリマーを原料分子の記述子と組成比の線形和で表現し回帰モデルに線形モデルを選定することで、39サンプルのポリマーデータからモデル構築した。原料分子の記述子として文献値でなく分子構造に対して計算される分子記述子を使用することで、構造生成にも適用しうるモデルの構築を目指した。構築したモデルを利用して目的物性値に近づけるように原料組成比を最適化し、また、原料の構造生成を行った。フラグメント記述子で原料を表現したため、構造生成にあたりmol2vecを用いてフラグメント記述子の分散表現を活用した。原料組成比を最適化した結果を実際に合成したところデータになかった組み合わせにおいて目的物性値が最も目標値に近づいた。本発表では方法論に焦点を当てて紹介する。
  • 藤芳 明生
    p. 2A02-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    正規表現によって文字列検索の利便性が飛躍的に向上したように、化学構造検索の利便性向上のため、既存の化学構造表記法SMILESを拡張した正規表現拡張SMILESを提案するとともに、それを用いた化学構造検索手法を紹介する。正規表現拡張SMILESは、発表者が研究を続けている有限グラフオートマトンに容易に変換可能であり、有限グラフオートマトンを用いた部分グラフ探索アルゴリズムを適応することができる。
  • 田村 峻佑, 宮尾 知幸, 船津 公人
    p. 2A03-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    Activity cliff (AC)とは類似した化合物であっても薬理活性が大きく異なる現象である。ACを予測することは創薬分野におけるリード化合物探索の効率化へつながる。既存手法ではAC予測をリガンドベースで行ったものがあるが、主骨格と置換基の結合点の位置が異なる構造同士の類似度が過大評価されているため、訓練データに同一の主骨格を有する構造がない場合予測精度が著しく低下するといった問題が挙げられる。本研究では、結合点の位置情報を考慮したAC予測スキームを提案した。提案したスキームを用いて、訓練データに存在しない主骨格を有する化合物におけるAC予測精度を検証した。いくつかの標的マクロ分子に対して提案手法を適用した結果、既存の予測スキームに比べ精度が向上することを確認した。
  • 杉本 学, 石出 愛美, 武田 季詩子
    p. 2A04-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    本研究は電子的記述子と抗菌活性との相関を調べ、抗菌活性の高い分子を予測することを目的として行なった。まず、大腸菌に対するMICが報告されている分子27個の電子状態計算を行い、11個の電子的記述子を得た。これを用いて重回帰分析を行なった。その結果、p値が0.05以上のものが存在したため、最もp値の大きな説明変数を1つ除く変数減少法による変数選択を行なった。その結果、抗菌活性に影響を及ぼすと考えられる4つの記述子が選択された。また、この4つの説明変数を用いて作成された回帰モデルの決定係数は0.763であり、MICと電子的記述子との間に良い相関が見られた。得られた予測式を用いて147個の天然物のMICを予測した。その結果、抗菌活性の高いと予測した分子の中に、実際に抗菌作用を有するものが含まれていた。
  • 小野 直亮, 宮崎 優, 金谷 重彦
    p. 2A05-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    近年、分子構造から機械学習を用いて分子の特徴を抽出し、分子の構造類似性を評価した分類に用いたり、生化学的な活性、例えば、化合物と標的タンパク質に対するリガンド活性を予測したりするといった手法がさまざまな応用に使用されている。本発表では、その中でも深層学習のモデルを化学分子に応用した、分子グラフコンボリューションニューラルネットワーク(MGCNN)を用いて、分子構造に基づく学習と解析をより効率よく実現する応用について紹介する。
一般公演(B公演)
  • 樋口 千紗, Dragos Horvath, Gilles Marcou, 吉澤 一成, Alexandre Varnek
    p. 1B01-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    高分子のガラス転移温度(Tg)を機械学習を用いて予測することを目的とする.サポートベクトルマシーンを用いて,線形ホモ(ヘテロ)ポリマーと網状化することが知られているエポキシ樹脂を対象にTg予測モデルを構築した.このモデルは線形ポリマーと網目状ポリマーの両者を対象としたTg予測を可能とする.我々は270種の高分子に対して,予測精度Q2 = 0.920のモデル構築に成功した.また,GTM (Generative Topographic Mapping)によりポリマーの多次元の“ケミカルスペース”を2Dマップ上で可視化し,Tgのポリマー化学構造との相関を解析した.
  • 宮尾 知幸, 船津 公人
    p. 1B02-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    Iterative screening (IS)とは、大量の化合物を一度にスクリーニングするヴァーチャルスクリーニングに対して、少数の化合物をスクリーニング、薬理活性を測定、測定した活性値を用いてモデルを更新、このサイクルを繰り返し行うスクリーニング手法である。本発表では、様々なシナリオにおいて、機械学習手法を用いて、ISを化合物探索に適用した結果について報告する。結論としては、物性値を記述子から線形に推定できる場合は、変数選択を取り入れた線形回帰モデルが機能した。モデルの適用範囲を考慮することは、必要な実験回数を増やす結果となった。また、Gaussian Processを用いた、すでにサンプリングした化合物にペナルティを与えるバッチベースの手法が、いずれの想定したシナリオにおいても、総じて少ない回数で、目的とする物性や活性を持つ化合物を同定することに成功した。
  • 吉田 一輝, 杉本 学
    p. 1B03-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    近年、機械学習を用いた化学および材料化学の研究が盛んに行われている。しかし、これらの分野の実験には多くの時間や費用を必要とするものが多いため、機械学習に利用可能な実験データの数は限定的であり、一般的に言われる「ビッグデータ」からはほど遠いのが現状である。本研究では、機械学習を用いて化学法則を再現する上で必要なデータ数を明らかにする目的で、電子移動反応速度に関するMarcus理論式を用いて実験値の代わりになるデータを生成し、検討を行なった。式中の反応基質の特徴を反映する3つのパラメータを乱数を用いて生成し、学習データとテストデータを各1000個作成した。学習データから任意の数を取り出し、0~30%の誤差を追加し、サポートベクターマシン(SVR)によって予測を行うことで性能を比較した。結果として学習データに誤差が含まれない場合にテストセットのR2値が0.8以上となるには、最低でも30個以上のデータが必要との結果になった。
  • 寺前 裕之, 玄 美燕, 山下 司, 高山 淳, 岡﨑 真理, 坂本 武史
    p. 1B04-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    フェルラ酸(FA)は比較的強い抗酸化作用を示すことが明らかになっている。本研究では坂本らの研究によりDPPHフリーラジカル消去能の測定で得られた50%のDPPHフリーラジカル消去濃度(IC50)を元に、FAとその誘導体のフェノール性水酸基から水素を取ったラジカルの電子状態とIC50との関連性を複数の機械学習により検討した。
  • 井上 貴央, 田中 健一, 小寺 正明, 船津 公人
    p. 1B05-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    近年、機能性有機分子の開発が盛んに行われている。開発の効率化のための手段として構造生成器の利用が挙げられる。目的物性を有する構造を生成するために設計された構造生成器DAECSに対し、本研究では生成構造の多様化に取り組んだ。構造変化ルールとして、結合の縮約ルールと環の併合ルールの二つを追加した。構造生成の起点となる構造を生成構造群から選ぶ際に、選択範囲の制限とクラスタリングを組み合わせることで、生成構造群の多様性の向上を目指した。提案手法を評価するためヒスタミンH1受容体に対するリガンド構造の生成を行い、生成構造の分布と、ターゲット座標近傍に生成された構造群の平均Tanimoto距離を確認した。構造生成実験の結果、提案手法で多様性が改善したことが分かった。また、提案手法により新規な構造を得る可能性があることが示唆された。
  • 藤田 眞作
    p. 1B06-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    各種Oh骨格(正八面体, 正六面体, 立方八面体, 切頭八面体, および切頭六面体)を区別するために,新規に開発した結合置換表現を用い,GAPシステムにより,マーク表とUSCI-CF表を求める。これらの表は,GAPシステムでもとめた場合には骨格ごとに異なるので、新規に開発した関数により標準化して,単一の標準マーク表と標準USCI-CF表を求める.藤田のUSCIアプローチ (S. Fujita, Symmetry and Combinatorial Enumeration in Chemistry, Springer-Verlag, Berlin-Heidelberg, 1991)を適用して,これらの骨格に基づく誘導体の数え上げをおこなう.
  • 大嶋 悠司, 進藤 裕之
    p. 1B07-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    化合物の発見や合成経路探索の機械学習を用いた効率化が注目されており,その中で文書データから科学知識を抽出する作業の自動化が求められている.文書データから化合物名などを抽出するタスクである固有表現抽出は初歩的かつ重要な処理である.固有表現抽出ではBiLSTM-CRFと呼ばれる確率モデルが用いられることが多く,BiLSTM-CRFでは単語列を入力とするが,その単語列は分散表現と呼ばれるベクトル列にモデル内で変換される.近年文脈を考慮した分散表現を用いることで固有表現抽出の精度が向上することが知られている.そこで本稿ではこれらの手法を化学情報分野にも応用し,文脈情報を考慮した分散表現とBiLSTM-CRFモデルを組み合わせることで従来の手法と比較して化学固有表現抽出の精度向上に寄与することを明らかにした.
  • 中原 真希, 宮尾 宙, 向田 志保
    p. 2B01-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    エポキシ樹脂などを用いて作られる接着剤は用途によって多様な目的物性があり、用いる材料と組成によって異なる物性が発現する。従来、研究者の知見と勘によって目的物性を達成するように組成が最適化されてきた。各材料が物性に及ぼす影響は完全には解明されておらず、目的に達するまで数多くの実験が必要になることが新製品開発の課題となっている。この課題を解決するため、接着剤の組成から目的物性を予測する機械学習モデルの構築を試みた。本発表では、接着剤で着目される物性の一例であるガラス転移温度、透湿度、接着強度に対するモデルを構築した結果について述べる。また、大量の候補組成を発生させて予測を行い、目的物性が発現すると予測された組成について実験で検証を行った結果についても併せて報告する。
  • 北井 孝紀, Jiang Guo, Shenghong Ju, 田中 周, 津田 宏治, 塩見 淳一郎, 田村 亮
    p. 2B02-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    近年の材料合成技術の進展に伴い、機械学習を利用した材料設計の重要性は増している。これらの問題はブラックボックス最適化として捉えられ、入力変数の次元とともに候補解の数が指数関数的に増大するため、一般に困難な問題と考えられている。我々は機械学習の分野で知られた回帰モデルであるFactorization MachineとD-Wave 2000Q等の実装に代表される量子アニーリング技術を組み合わせることで、量子・古典ハイブリッド型のブラックボックス最適化アルゴリズムを提案し、材料の自動設計問題へも適用した。量子アニーリングは候補解の中から予想される最適解を高速に選ぶことができ、実行時間の短縮に繋がった。RCWAと呼ばれる電磁場解析手法と組み合わせることで、選択的な波長領域においてのみ強い熱放射を示すメタマテリアルの設計を行い、本手法の有用性を示した。
  • 福島 真太朗
    p. 2B03-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    近年,機械学習を用いて物性を予測したり,結晶構造を探索したりする研究が行われている.本研究では,生成モデルを用いた結晶構造生成について考える.この問題に対して,CrystalGANと呼ばれる手法が提案されている.この手法は”A-H-B” (A, B:金属,H:水素)という結晶構造を持つ化合物を探索するために,異なるドメイン間を横断した生成モデルであるDiscoGANを使用する. CrystalGANは,結晶構造生成の簡便な手法である.一方で,POSCARファイルに記録された格子ベクトルと,水素や金属の座標を結合して特徴量を構築するため,結晶の幾何学的構造の反映が十分ではないという問題点がある.本研究ではこの問題点を解決するために,結晶をグラフ構造で表現して幾何学的構造を織り込み生成モデルを学習する方法を提案する.
  • 高尾 基史, 鳥屋尾 隆, 前野 禅, 高草木 達, 瀧川 一学, 清水 研一
    p. 2B04-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    文献から入手したメタン酸化カップリング反応の実験データに関して、触媒組成と反応条件を予測記述子とした機械学習モデル、さらに、構成元素の特徴量を加えたモデルを用いて触媒活性の予測を行った。前者に比べて後者では予測精度の良化が見られた。最良の予測を示したXGB Regressorを用いた予測結果に対して、SHAPを用いて各特徴量の寄与の可視化を行った。反応温度や反応気質の分圧等、実験条件ならびにMn、Na、LiなどのMn/Na 2 WO 4 /SiO2 系触媒やLi/MgO系触媒の構成元素が高く評価された。近年特に注目されているMn/Na 2 WO 4 /SiO 2 系触媒に関して、PDPを用いて元素組成と収率の関係の可視化をおこなった。また、SMACをベースとした代理モデルを用いて最適な触媒組成および反応条件の探索をおこなった。
  • 岡澤 一樹, 辻 雄太, 吉澤 一成
    p. 2B05-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    π共役単一分子は、バルクの金属にはない特異な電子輸送特性を持っている。近年、単一分子の伝導度の測定に関して様々な手法が開発された。理論面においてもLandauerの式によって伝導度と電子透過確率の関係が示され、非平衡Green関数法により電子透過確率と電子状態の関係が示されたことにより、定性的な議論が可能となり、傾向の予測に用いることが可能なレベルに到達した。単一分子スケールの電子部品を開発するには、回路の法則が必要である。実際、ナノスケールの並列回路の法則はすでに提案されている。しかし、最近の報告で、同じ分子骨格でも、芳香族性の違いによって伝導性が大きく変化することが明らかになったが、未だに原因の解明には至っていない。そこで本研究では、非平衡Green関数 (NEGF) と量子化学計算(Hückel分子軌道法、及び密度汎関数理論)を組み合わせた手法、及びフロンティア軌道論を用いて、並列回路の伝導度と芳香族性の関係を解明した。
  • アルフガファーリ バクティ マンガラ, 杉本 学
    p. 2B06-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    本研究では、密度汎関数(DFT)法を用いて、Tetrahymena pyriformisに対して毒性を示す33のアルキルフェノール分子を計算した。物理化学的考察から得られた29の記述子を評価し、毒性予測のための統計モデルを導出するために、回帰分析を実行した。ランダムフォレスト法を用いたところ、良好な毒性予測モデルを得た。記述子の部分セットをいくつか定義して回帰分析を行なった結果、アルキルフェノールの毒性を記述する上で分子サイズのパラメーターが重要であることがわかった。
  • 井上 貴文, 吉田 一輝, 本間 光貴, 福澤 薫, 杉本 学
    p. 2B07-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    新薬探索では、標的タンパク質とリガンドの間の相互作用の強さを電子状態計算で定量的に評価する手法として、フラグメント分子軌道(FMO)法が注目されている。FMO法は計算コストを劇的に改善する優れた手法ではあるが、数多くの化合物を対象とするバーチャルスクリーニングを行うには現時点では不向きである。このため新薬候補となるリガンドをあらかじめ絞り込む手法と組み合わせて利用することが必要であると考えられる。本研究では、FMOデータベースを活用した機械学習により、注目するタンパク質とリガンドの相互作用強度をリガンドの特徴を表す電子的記述子のみで再現できないかと考えて検討を行なった。p38 MAP kinaseリガンドを対象としてランダムフォレスト回帰モデルを構築したところ、電子的記述子と相互作用強度との間には良好な相関が確認された。このことから、得られた回帰モデルを用いれば、p38 MAP kinaseに強く結合する候補化合物のバーチャルスクリーニングが可能であると期待される。
  • 堀 憲次
    p. 2B08-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    合成経路設計システムにより創出される経路は、①多くの場合前駆体の合成が合成困難、②多段階合成では、合成経路の数が発散する、③提案合成反応は標的分子を主生成物として与えない可能性がある、などの理由により標的分子の合成を保証しない。①はSAスコアを計算することで、②はin silicoスクリーニングと実験の組み合わせにより解決できる。本研究では、③について、RDkitを用いて可能性のある反応を予測し、それらについて理論計算を行うことにより、どれが主反応であるかを決める手順を作成することを試みた。これは、複数の生成物が予想される反応では、単にTS構造を求めるだけでは不十分で、最も低い活性化自由エネルギーを与えるTS構造を求めて比較することで始めて、主生成物がどれであるかを判定できることによる。開発された手法をEne反応に対して適用し、主生成物が何であるかについて予測できる可能性が示された。
  • 亀井 健太, 仲澤 英祐, 土屋 諒介, 荒川 正幹, 高橋 崇宏
    p. 2B09-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    本研究は半導体デバイスの製造に用いるCVD法を対象とする。CVD研究開発過程全体の自動化を目指し、反応モデルの同定を目的とした実験計画を自動的に立案するシステムの開発と評価を行った。従来のシステムではCMA-ESを用いたアルゴリズムを採用していたが、劣解が多く生成され、反応機構の同定に有効でない実験条件候補が多く提案された。そこで、本研究ではSPEA2を用いたアルゴリズムを採用し、劣解群を避けてパレート解群を生成することを試みた。また、得られた解の分類方法として、クラスター数を自動で決定するx-means法を新たに導入し、システムの更なる自動化を目指した。
  • 仲澤 英祐, 増岡 大起, 鈴木 健太, 高橋 崇宏
    p. 2B10-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    化学気相成長法(CVD:Chemical Vapor Deposition)は、半導体製造における微細加工の主力プロセスとして広く用いられている。CVD装置内部の解析を低コストかつ高速に行う為には、成膜速度分布の計算が非常に重要な役割を持っている。成膜速度分布は、物質収支式などの支配方程式を解くことで求められる。しかし、この計算は数値積分の繰り返し計算が必要であり計算コストが大きくなり問題となっている。そこで本研究では、多様な形状のCVD反応器において物質収支式を行列とベクトルを用いて定式化し、行列関数を用いた厳密解を導出した。この厳密解による計算は、従来の数値積分による方法と比較して、同程度の高い計算精度を維持しつつ、大幅に計算速度が向上できることがわかった。この成膜速度分布の厳密解を利用したアルゴリズムの実装によって、様々な形状のCVD反応装置の反応機構解析を高速かつ高精度に行えるようになった。
  • 野田 恭平, 五十嵐 康彦, 中田 玄徳, 今井 宏明, 緒明 佑哉
    p. 2B11-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    我々の研究グループでは、小規模な実験データと研究者としての経験や勘を融合した実験主導型マテリアルズインフォマティクに取り組んでいる。本研究では、層状酸化チタンおよび層状酸化マンガンについて計128通りの条件ではく離を行い、得られるナノシートの収率を測定した。回帰分析を用いたスパースモデリングにより、35個の説明変数の中から、収率への寄与の大きいパラメータを16個に絞り込んだ。さらに化学的考察により説明変数を16個から2個に絞り込み、この2つの変数を用いて収率の予測式を作成した。次に未知の層状物質について、予測式を用いた収率予測を行い、最小実験数で高収率にナノシートが得られる条件を見つけることができた。
  • 吉田 将隆, 斎藤 雅史, 蒲池 高志, 辻 雄太, 吉澤 一成
    p. 2B12-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    天然ガスの主成分であるメタンは水蒸気改質(金属触媒と800 ℃以上の高温が必要) により水素と一酸化炭素の合成ガスに変換され、その後種々の化合物となる。現在のメタン水蒸気改質反応では反応性やコストのために、主にNi が触媒として使われているが、初めの強固なメタンのC–H開裂の活性化エネルギーは極めて高いのに対し、続く2 回目、3 回目の活性化エネルギーは比較的低く、CH*が他の中間体に比べて圧倒的に安定である。このため、メタンをCH3* とH* に切断するほど活性の高い金属表面では、C–H結合の解離が進み、エネルギー的に最安定なCH*まで分解されてしまう。反応途中段階のCH3* やCH2* をCH*よりもエネルギー的に安定にできれば、CH3* やCH2* の寿命が長くなり、有用な化合物に直接変換される可能性が高まる。我々は二成分合金に着目し、DFT計算と、その結果を機械学習などから理解する触媒インフォマティクスにより、表面上でCH3* がCH*よりも安定な材料を探索した。
ポスター発表
  • 清田 浩史
    p. 1P01-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    テルペノイドは主要な二次代謝産物のグループの1つであり、多様な物性・生理活性を持つことから、香料・医薬品・燃料などに幅広く利用される。テルペノイド生合成においてはその途中段階でテルペンシンターゼと呼ばれる酵素によって共通の前駆体から様々なテルペン骨格が形成される。テルペンシンターゼには反応特異性があり、それぞれのテルペンシンターゼは決まったテルペン骨格の形成を触媒する。したがってそのアミノ酸配列と反応特性との関連性を理解することは目的のテルペノイドを生物工学的に生産するといった応用面においても重要であるが、その対応関係はいまだ明らかではない。そこで、テルペン骨格を炭素間の結合のグラフとしてテルペンシンターゼのアミノ酸配列との間の相互変換を行うニューラルネットワークモデルを作成することでテルペン骨格の構造とアミノ酸配列との対応関係を検討する。
  • 金谷 重彦, 小野 直亮, 森田 晶
    p. 1P02-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    メタボローム研究を中心に薬用・植物知識ベース(機能性、配合)、さらにヒト生理活性を統合的に扱うデータベースKNApSAcK Family DB(http://kanaya.naist.jp/ KNApSAcK_Family/)の構築を進めている。メインウインドウを図1に示す。KNApSAcK Core Systemには、生物種と二次代謝物の関係データ情報が整理されており、現在までに、114,238レコードの生物種-二次代謝物の関係、二次代謝物の総数は51,086種となっている。さらに、アルカロイドにおける生合成経路データベースCobWebを開発した。本データベースを活用し、グラフコンボリューションニューラルネットワークにより、代謝経路既知のアルカロイド化合物を生合成開始物質へ分類したところ、非常に良好な識別結果を得た。
  • 菱沼 雅, 田中 健一, 船津 公人, 小寺 正明
    p. 1P03-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    天然化合物は、その豊かな生物活性により研究者の関心を惹き続けている。しかし、天然化合物 の複雑な分子骨格を生合成する一連の酵素反応 は極めて難解であり、有機合成反応論では想定し得ない反応が多数存在する。本研究では、天然化合物の二次代謝経路に焦点を当て、その代謝経路 を適切に算出する in silico ツールの開発に取り組んでている。 本稿では、天然化合物の二次代謝経路の in silico 再現の試みにおける成果を報告する。
  • 田中 弥, 大沼 かおり, 三瓶 真菜, 佐々木 一謹, 山本 博之
    p. 1P04-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    本プロジェクトでは、メタボローム解析においてしばしば問題となる未知化合物の構造推定に、2種の独立したアプローチで取り組んだ。一方は一般的に用いられるタンデム質量分析 (MS/MS) を用いた推定であり、もう一方は代謝に基づく発表者ら独自の推定である。これにより十種程度の未知化合物の同定に成功してきたが、それには一方の手法がより良い推定を示したものも、両方の手法にて有力候補となったものも含まれていた。置換基の位置のようにMS/MSでは得にくい情報も、前駆体探索により構造推定に取り組むことができた。一方で、前駆体探索が困難な構造の化合物では、MS/MS による推定がより有力であることが考えられる。独立した2手法を用いることでそれぞれが得意な推定対象を補完しあい、また両手法の結果の組み合わせからより精度の高い推定を導くことが可能となった。
  • 水上 善博
    p. 1P05-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    ダイオキシンやダイベンゾフランなどのダイオキシン類は急性および慢性毒性を有する化合物である。核酸塩基とダイオキシン類の相互作用について分子軌道計算で解析を行った。核酸塩基としてはアデニン、シトシン、グアニン、チミン、ウラシルのモデル分子を用い、ダイオキシン類としては、毒性等価係数の大きい2種のダイオキシンと2種のダイベンゾフランのあわせて4つの化合物を対象として計算を行った。計算方法はHF法で求めた最適化構造に対してMP2計算を行って、安定化エネルギーを求めた。その際、重なり誤差の補正を行った。核酸塩基とダイオキシンの安定な構造が得られた。核酸塩基とダイオキシン類の安定化エネルギーはワトソンクリック塩基の安定化エネルギーのおよそ半分以下であったが、核酸塩基とダイオキシンが水素結合を形成する可能性を示唆する結果が得られた。
  • 王 書明, 周 怡, 田 雨時, 高木 達也
    p. 1P06-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    近年、DNAマイクロアレイの実用化に伴いて、機械学習の手法を用いて、DNAマイクロアレイデータからがんの予後を予測する報告が増え、複数の弱分類器を利用したモデルが公表されている。しかし、複合型学習分類器を用いた報告がまだ少ない。本研究は、先ずLasso回帰で重要な特徴を抽出して、その後、乳がん患者の5年生存率予測における複合型アルゴリズムであるスターキング法の有効性を六つ単一分類器(サポートベクトルマシン、ロジスティック回帰、ランダムフォレスト、XGboost、 GBDT、k近傍法、)と比較検証するとともに、5年生存率に影響する因子の探索・分析を行った。評価指標ACC, TPRとAUCによって、スターキング法の性能が単一分類器より良いことを確認できた。
  • 富山 顯, 小寺 正明, 田中 健一, 庄野 文章, 船津 公人
    p. 1P07-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    現在、日本では化合物の毒性試験として、化審法に基づき、動物への28日間反復投与試験が行われている。この試験には1化合物あたり数千万円という高額な試験費用、長期試験期間による日本の科学産業の競争力低下、倫理的問題といった問題点が存在する。また、従来の定量的構造活性相関(QSAR)のみを用いた機械学習の毒性予測モデルにおいては、化合物の細胞等への作用機序がブラックボックスであること、モデルの適用範囲が明らかでないことといった点が問題である。そこで、最初に「化合物が体内に吸収されるか」を予測し、吸収されるものについて「化合物情報から細胞毒性試験結果」を、さらに「化合物情報+細胞毒性試験結果から各臓器についての毒性」を予測するという3段階のモデル構築を考え、各モデルについて適用範囲(AD)を明らかにすることを目指す。今回、「化合物情報から細胞毒性試験結果」を予測するモデルについて、様々な外れ値検出の手法を使用して解析を行い、AD設定の指標としてどの手法が有効であるかを調査した。
  • 草地 嵩, 高羽 洋充
    p. 1P08-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    質量分析装置は得られたスペクトルからデータベースとの照合により分子構造を同定する装置であるが、未測定の分子は同定が困難である。本研究では、データベース内のスペクトルを学習し分子構造を推論するDeep Learning法の開発を行った。分子構造を組み立てて推論を行うため、データベースにない分子構造であっても推論が可能で、分子構造の潜在表現を用いることで高い類似性を持った分子構造の推論に成功した。
  • 張 金哲, 寺山 慧, 隅田 真人, 伊藤 研悟, 菊地 淳, 津田 宏治
    p. 1P09-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    NMR測定は試料中に含まれる分子を確定・同定する際に重要な測定である.通常,得られたNMRスペクトルのピーク位置は分子の官能基・部位毎に異なることから,データベースなどを参照し,知識を持つ人の手によって帰属が行われ,試料に含まれる分子の確定・同定を行うことが可能である.しかし,人が介入することから,客観性や人の労力の観点から問題になることもある.このような問題に対処するために,我々はNMRスペクトルから機械学習と探索アリゴリズムを用いて自動的に含まれる分子を同定する手法開発に取り組んでいる.本発表では,量子化学計算とde novo 分子生成機を組み合わせた手法で,所望のNMRスペクトルを持つ分子を設計することにより,分子を同定する手法の自動化の取り組みを紹介する
  • 伊藤 真利子, 大西 立顕
    p. 1P10-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    化合物空間をネットワークにより表現することで空間の特徴を捉えようとする試みが先行研究でされている.このネットワークでは頂点が化合物を表し,二つの化合物の類似度がある閾値よりも高ければ頂点間にリンクが張られる.しかし,ネットワーク構造は閾値の設定に大きく依存する.そこで本研究では,二頂点間のリンクの重みを化合物の類似度とした重み付きネットワークを考える.生物活性低分子データベースのChEMBLから各ターゲットに対する化合物のデータを取得し,それらの重み付きネットワークの構造を解析した.その結果,極めて強く他の頂点とつながるような頂点は見当たらなかった.またネットワーク全体のコミュニティ構造は弱かった.しかし部分的に,互いに強くつながり合い,全体とは異なる生物活性分布をもつ化合物の集合が見られた.また特に強い(もしくは特に弱い)生物活性値をもつ化合物同士は強くつながり合っていることもわかった.
  • 若杉 昌輝, 金子 寛, 川﨑 惇史, 西端 芳彦
    p. 1P11-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    創薬段階でのコンピュータを用いた候補化合物のデザインにおいて、合成ができるかどうかを考慮することが重要である。しかし、既存の予測手法ではうまく評価できない化合物が報告されているため、機械学習を用いてより網羅的な予測手法の構築を目指した。まず、C、N、O、S、ハロゲンが17原子までで構成された理論上化学構造的に問題ない全ての化合物を数え上げた化合物(GDB-17)から市販化合物(ZINC15)を除いた化合物群は合成が困難な可能性が高く、一方ZINC15の化合物はこの化合物群よりも合成が容易と仮定して機械学習に用いるデータセットを作成した。そして、ニューラルネットワークによって合成容易性予測モデルを構築し、文献から得られた検証セット(40化合物)を予測したところ、合成が困難な化合物群と合成が中程度〜容易な化合物群に判別できた。現在ランダムフォレストによる予測を検討中であり、ニューラルネットワークでの予測結果との比較も報告する予定である。
  • 加藤 涼太, 田中 健一, 小寺 正明, 船津 公人
    p. 1P12-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    化合物の物性を予測する手法の一種に、定量的構造物性相関(QSPR)がある。QSPRでは、物性既知の化合物を用いて化合物の構造と物性値の間の関係を統計的手法でモデル化する。QSPRの入力として化学構造から計算した記述子を用いる場合、多くの記述子の中から最適な組合せを見つけなければならず、その中に予測に必要な情報が十分に含まれているか分からないという問題もある。そこで、本研究では記述子を計算することなく原子の3次元座標値と原子番号および分子のグラフ構造を入力とし、Graph Convolutional Neural Network(GCNN)を用いた予測手法を開発した。記述子を用いる手法と比較した結果、予測タスクによって提案手法が勝る場合も劣る場合もあった。その原因としてモデルの表現力の不足が考えられるため、入力方法やモデル構成を改良することで性能が向上すると考えられる。
  • 堤 拓朗, 小野 ゆり子, 荒井 迅, 武次 徹也
    p. 1P13-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    固有反応座標(IRC)はポテンシャルエネルギー超曲面において遷移状態構造を介して2つの安定構造を結ぶ最小エネルギー経路として定義され、素反応過程に対応する反応経路として用いられている。近年、反応経路自動探索法によりIRC経路の系統探索が可能になり、グローバル反応経路ネットワークの概念が生まれたが、多次元空間における分子座標の位置関係を考慮した反応経路地図の作成は困難であった。ごく最近、我々は次元縮約法である主座標分析をネットワークの可視化に適用することで分子構造間の距離関係をできるだけ保つような反応経路地図を作成した。本研究では、IRC経路を低次元化することで得られる主座標空間に分子動力学計算から得られる古典軌道を射影することで、静的反応経路に基づき動的反応経路を議論する。
  • 脇谷 拓真, 鎌倉 吉伸, 田中 大輔
    p. 1P14-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    配位高分子は、金属イオンと架橋配位子から構成される構造体であり機能性材料として注目されている。現在、報告されている配位高分子の大多数は金属架橋部に酸素や窒素元素を含む構造となっており硫黄等を架橋部に含む構造は先行研究例が乏しく非常に少ない。一般的に新規配位高分子を合成する際は既報の報告を参考にして合成を行うが先行研究例が少ない物質では合成指針がない為、試行錯誤的に実験条件のスクリーニングを繰り返す必要があり膨大な時間を要してしまう。そこで我々は、機械学習の手法を活用し効率の良い合成条件の最適化を目指した。ハイスループット合成により得られる生成物に粉末X線回折測定を行い、その回折パターンをクラスタリング分析による自動分類をし、合成条件と回折パターンのデータセットを決定木学習により両者の相関を評価することで未知の結晶相を得られる条件だけでなく結晶構造に関する化学的考察も得られることを実証した。
  • 秋田 隼平, Guo Jing-Yao, Sigman Matthew S., 野崎 京子
    p. 1P15-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    官能基化ポリオレフィンの合成法の1つとして、パラジウム・ホスフィンスルホナート(Pd/PS)錯体を用いた直接共重合反応が注目を集めており、これまでに様々な研究室から報告されている。これまでにリン上の置換基の電子的効果および立体的効果の両方が影響するという報告例がある。本研究では、これらの効果の包括的理解を目指してPd/PS錯体を用いたエチレン/アクリル酸メチルの共重合反応の結果について解析を行った。DFT計算によって求めたパラメータを用いて機械学習を用いた予測を行うと、触媒活性と得られたポリマーの分子量の片方にのみ関係するパラメータをそれぞれ知ることができた。
  • 永野 駿介, 中野 宏明, 高橋 亮則, 畑中 美穂
    p. 1P16-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    塗料の硬化は、含有アルキド樹脂の重合が元で起こるとされており、塗料には硬化を加速するための金属錯体触媒が微小量添加されている。この金属錯体触媒の配位子や中心金属の組み合わせにより硬化時間が変化することが実験的に確認されている。しかし、金属錯体触媒がどのように樹脂の硬化に関与しているのか分かっていないため、錯体の設計には膨大な実験検証が必要であった。そこで、本研究では反応経路自動探索(Global Reaction Route Mapping: GRRM )プログラムに実装されている人工力誘起反応法(Artificial Force Induced Reaction:AFIR) 法を用いて反応経路の網羅的探索を行うことで、反応機構を理論的に解明する。また、解明した反応機構から硬化を促進する因子を特定し、新規錯体触媒の設計に応用することを目指す。
  • 奥野 博貴, 畑中 美穂
    p. 1P17-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    後期14族原子(Cr)4つを含む化合物 (Cr4R4)は、側鎖(R)にかさ高い置換基を導入することではじめて平面四員環構造を形成し得ることが知られている。さらに近年では、かさ高い置換基なしには単離できないような特殊な環構造を用い、小分子の反応させることで、更に複雑な環構造が得られるという事例も報告されている。このように、置換基を制御することで特殊な骨格を持つ化合物の合成が可能になってきたが、複雑な置換基は合成が困難であるため、望む骨格の生成に必要な置換基の設計や予測が求められている。そこで本研究では、Cr4H4 (Cr = C, Si, Ge, Sn)の局所安定構造と遷移状態を反応経路自動探索を用いて網羅的に調べる。これらの構造の電子状態や結合性、反応性(壊れやすさ)だけでなく、それらの側鎖の置換基に対する依存性を調べることで、望む骨格を安定に得るための置換基の設計指針を得ることを目指す。
  • 巳上 幸一郎
    p. 1P18-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    本研究では DFT 計算と機械学習を利用することで触媒反応メカニズムに及ぼす因子に関する情報を整理し、新たな知見を得ることを目的とした。触媒反応としてはメタロセン触媒におけるエチレンの配位-挿入反応を選択し、多数の錯体に対して DFT 計算による理論反応経路解析を実施した。得られた活性化エネルギーなどの物性値を目的変数、反応の始状態における立体的な効果 (Sterimol parameters (L, B1, B5)、Tolman-cone angle (T-CA), metal-centroid distance (MC-dist)) と電子的な効果 (LUMO, NPA) を説明変数とした機械学習を通じて、触媒反応の各段階でどのような記述子が影響を及ぼすかを調べた。
  • 山本 寛人, 田中 健一, 山下 俊介, 浮田 昌一, 中野 博史, 白沢 楽, 冨谷 茂隆, 小寺 正明, 船津 公人
    p. 1P19-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    電子エネルギー損失分光法(EELS)から得られたスペクトルデータの解析手法について報告する。EELSは電子線を試料に照射し、透過した電子線に磁場をかけて分光し、エネルギー損失から試料の状態を推定する分析手法である。提案手法では、EELSスペクトルデータに2種類の前処理を適用し、主成分分析による解析を行った。ドライエッチング時のダメージの状態把握および、GaInN量子井戸におけるインジウム含有量の推定結果について報告する。
  • 中平 浩輔, 隅本 倫徳, 堀 憲次
    p. 1P20-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    コンピュータの普及・高速化に伴い、計算化学を化学反応の理論的考察において重要な役割を果たしている。また、情報科学的手法も化学反応を研究するツールとしてその重要性が増している。本研究では、この二つの手法を組み合わせ、計算化学で最も困難とされている遷移状態の探索を行わずに置換基の異なる基質により変化する活性化自由エネルギーΔG‡の予測を試みた。その目的で、aza-β-lactamがprotein phosphatase methylesterase 1(PME-1)の活性を阻害する反応を対象にPME-1のセリン残基をメタノールでモデル化し、体内での反応を考慮して水一分子を取り入れた反応機構に対して理論計算を行い、得られたΔG‡を目的変数とする多変量解析を行った。説明変数には理論計算により得られた反応物のHOMO、LUMOのエネルギー準位やGRAGONプログラムが作る構造因子に関わるパラメータ及びWinmosterを用いて算出した分子体積も併用した。Chemishプログラムを用いてPLS回帰分析を実施したところ、LUMOのエネルギーやハメットのσ値が大きく関与するR2=0.932、Q2=0.915の良好な回帰モデルが得られた。
  • 林 慶浩, 川内 進
    p. 1P21-
    発行日: 2019年
    公開日: 2019/10/22
    会議録・要旨集 フリー
    狭バンドギャップ高分子の合理的設計に適した、モノマーの芳香族・キノイド性を表す記述子QSEを開発した。この記述子は、モノマーと結合部位のみを考慮したDFT計算から簡便かつ一義的に算出できる。QSEは高分子のバンドギャップと良い相関を示し、QSE=0付近でバンドギャップは最小となる。共重合体のバンドギャップは2つのモノマーのQSEの平均値と相関するため、狭バンドギャップ共重合体となるモノマーの組み合わせや組成比を予測できる。このQSEを基に、機械学習的な手法を用いて、モノマーの芳香族・キノイド性およびドナー・アクセプター性を表す記述子を用いた狭バンドギャップ高分子予測モデルの構築を試みた。その結果、良好な予測能が得られると共に、バンドギャップ予測に対するQSEの重要性も示された。
feedback
Top