Journal of Computer Chemistry, Japan
Online ISSN : 1347-3824
Print ISSN : 1347-1767
ISSN-L : 1347-1767
研究論文
分子模型キットからのコンピュータ解析用3次元構造ファイル取得を支援するMm2cMLソフトウェアの開発
矢部 誠陳 佳韻上田 一義武田 穣
著者情報
ジャーナル フリー HTML

2020 年 19 巻 1 号 p. 18-24

詳細
Abstract

分子シミュレーションや量子化学計算には,対象分子の3次元構造ファイルが必要である.3次元構造ファイルには,構成原子の種類や座標情報,およびそれらの結合に関する情報などが含まれ,論文やweb上のデータベースなど既存のデータソースから取得することができる.これが困難な分子でも,分子モデリングソフトウェアを用いれば3次元構造ファイルを構築することができる.もし,分子模型(実体分子モデル)から3次元構造ファイルを構築できるようになれば,分子模型の構造を初期構造として計算を実行することが可能となり,より多くの高校や大学などの初学者や研究者に対して計算化学的手法の活用が促されると期待される.そこで,市販の分子模型キットで作成した実体分子モデルを計算化学的解析へと導く技術の開発を目指し,要となる 3次元構造ファイル構築ソフトウェアMm2cMLを開発した.このソフトウェアを用いれば,対象とする分子模型の2次元画像データから3次元構造ファイル構築を経て計算化学的解析へと展開することができる.本プログラムはウェブアプリケーションであり,Structure from MotionおよびMulti-View Stereoの手法に,ウェブインターフェースを組み合わせたのが特徴である.ソフトウェアによって構築した3次元構造ファイルを用いて量子化学計算を実行し,その有効性を確認した.

1 序論

分子シミュレーションおよび量子化学計算の実行においては,対象分子の3次元構造情報(3次元構造ファイル)が必須である.3次元構造情報は,分子を構成する原子の種類や座標,結合等に関する一連の情報が盛り込まれており,多くの場合,PDBやCML,MOL2といったテキスト形式のファイルとして扱われている.一般的な分子の3次元構造ファイルはデータベースや論文などから入手することが可能であり,それらをそのままシミュレーションの初期構造情報とすることができる.データベース等から3次元構造情報を得ることができない分子の場合には,分子モデリングソフトウェアを用いて構造データを構築することができる.OSRA [1]のように,2次元構造画像から分子構造データを取得するためのソフトウェアはすでに存在するが,結合二面角などの3次元情報を得たり,任意に修正したりすることはできない.また,3次元形状の取り込みが可能な3Dスキャナで実体分子モデルをスキャンしたとしても, 得られるモデルから原子の種類や座標等の情報その他の3次元構造ファイルを構築することはできない.そこで,汎用機材で取得した視点の異なる複数の2次元画像からの3次元仮想分子モデル構築を経て構造情報を取得し,3次元分子構造ファイルを生成し計算化学的手法へと展開できるソフトウェアを構想した.分子模型キットで作成した構造を初期構造とする計算を実行できるようになれば,研究者にとっての計算化学の間口が広がると期待できる.高校や大学での教育の初期段階ではしばしば分子模型キットで分子モデルを作成する.作成した分子モデルを起点として分子の安定構造や挙動の予測といった計算までが可能となれば,初学者の化学に対する理解を深めることができるはずである.これらを実現するための技術の根幹となるのは,市販の分子模型キットから作った任意の実体分子モデルの2次元画像ファイルから,3次元座標および構造ファイルを取得できるソフトウェアである.今回のソフトウェア開発では,汎用デジタルカメラやスマートフォンのカメラ機能で得られた2次元画像群の統合による3次元化を経て仮想分子モデルとする手法を用いた.

2 開発環境

本プログラムはウェブアプリケーションとして,PHP [2],HTML及びJavaScriptを適用してインターフェースを作成することとした. グラフィカルについては,JavaScriptの3DライブラリであるThree.js [3]を用いた.また,仮想分子モデルの構築には,オープンソースソフトウェアopenMVG [4]とopenMVS [5]を活用することとした.さらに,仮想分子モデルの立体配座を含む3次元構造情報は,ウェブサーバ上で動作するデータベースで管理する仕様とした.

3 システム概要

本ソフトウェアの主要な構成要素は,(1)実体分子モデルの仮想モデル化と,(2)ウェブインターフェースを用いた3次元構造情報の入力および修正機能の2つである.処理プロセスの概要をFigure 1に示すとともに,手順を以下に記す.

Figure 1.

 Process flowchart

ユーザはまず,市販の分子模型キットを用いて目的の実体分子モデルを作成する.次に,デジタルカメラやスマートフォンのカメラ機能等を用いて,モデルをいくつかの異なった視点から撮影する.得られた複数の画像ファイルを1つのzipファイルに格納し,専用サーバにアップロードする.サーバ上ではアップロードされた画像ファイル群を基に3次元の点群情報として仮想分子モデルが生成される.さらにその情報から,原子の種類の簡易的識別(自動判定)が行われ,webブラウザ上に仮想分子モデルと識別された原子が表示される.分子モデルを構成する原子の種類や結合などの変更を要する場合には,実体分子モデルに立ち返ることなく,画面に表示されたツールを用いて仮想分子モデルを基に修正すればよい.修正中の一時保存も可能である.仮想分子モデルの3次元構造情報はCMLファイルとしてダウンロードできるので,これを分子シミュレーションの初期構造データとして用いる.

3.1 仮想分子モデル構築

本プログラムには,オープンソースソフトウェアであるopenMVGを組み込んだ.このソフトウェア(opebMVG)にはStructure from Motion (SfM)の手法が用いられている.SfMとは,複数の視点から撮影した画像群とカメラの動きから被写体の3次元形状を3次元の点群データ(電子データ)として復元する手法である.主な処理過程は以下のとおりである [6].

(1) 画像からエッジやコーナーという特徴の取得と座標算出

(2) カメラの位置・姿勢の推定

(3) 多視点画像計測による3次元点群生成

実体分子モデルから仮想分子モデルの3次元点群を生成するにあたっては下記の2点に留意する必要がある.

(留意事項1)撮影機材および撮影条件に関する情報(exif情報)は画像データに付随するデータとして,撮影時に画像ファイルに内に格納される.ソフトウェア(openMVG)内には撮影機器とそれに対応するセンサーサイズのリストが存在し,画像ファイル内に格納された撮影機材データを基に対応するセンサーサイズの数値を割り出して計算処理に用いる.これらのデータは,撮影後のトリミングや解像度の変更などを施すと失われ,その後の処理に支障をきたす.したがって2次元画像の加工は控えるべきである.

(留意事項2)複雑な模様を有する背景を用意しなければならない.分子模型キットで作成した実体分子モデルは,単純な幾何学形状および単調な色の部品の組み合わせで構成されることから,それ自体の2次元画像には3次元点群の生成の手がかりとなる特徴に乏しいことが下記のような経緯で判明した.すなわち,当初は特徴のない無地の背景で撮影した実体分子モデル画像群での3次元点群の取得を試みたものの,ほとんど成功しなかった.そこで,Figure 2のように鮮明かつ不規則な模様を紙に印刷し,これを背景として得た画像群を用いたところ,3次元点群を取得できた.なお,実体分子モデルは奥行が少なくなるように配置することが望ましく,画像数は10-25が適当である.

Figure 2.

 Typical photo of butane model assembled using the molecular model kit. Note that background of distinct and irregular pattern is desirable for creation of a 3D image from multiple 2D images of a real molecular model.

3次元画像化に至ったとしても,openMVGで生成される画像は疎な点群に過ぎず,そのままではユーザが分子モデルの形を認識できるほどの緻密さは得られない.そこで,Multi-View Stereoの手法(SfMでの再構成データを基に,より高密度な再構成を行う手法)により細密な点群への補完を試みることとした.本プログラムでの細密化にはオープンソースソフトウェアであるopenMVSを採用した.この処理を施すことによって,十分に細密な3次元画像を得ることが可能となった(Figure 3).なお,3次元点群の表示にはCloudCompare [7]を用いた.

Figure 3.

 3D image of virtual butane model obtained by processing with openMVG and openMVS.

このように,openMVGを用いた3次元点群生成からopenMVSを用いた細密化までの処理過程を自動に実行するプログラムを作成したことで,画像群を格納したzipファイルをユーザがアップロードするのみで自動的に処理が進行し,仮想分子モデルが得られるようになっている.光の反射等の撮影環境によっては認識できない部分が発生することがあるが,再構成後の編集過程で補えるので心配には及ばない.ただし,仮想分子の細密な3次元点群を得る処理は高負荷であり,過剰な解像度および画像数での再構成は避けるべきである.

3.2 構成原子の編集

仮想分子モデルとしての3次元点群が終了すると,原子の種類と座標の簡易的識別(自動判定)が行われる.本研究では,自動判定に対応する分子模型キットとして,丸善から販売されているHGS分子模型Aセットを採用した.各原子と結合がそれぞれ固有の色のパーツとして用意されており,色調に基づく原子の識別が可能であることが選定した理由である.なお,この自動判定は3次元点群を構成する点の色調と分布密度のみに基づく非常に単純なものであるため,用いる画像によって判定精度は大きく異なる.なお,結合の判定機能は具備していない.

自動判定が終了すると,webブラウザ上に構築した仮想分子モデルと種類と位置を識別された原子が表示される.表示された仮想分子モデルの構成原子のあるべき位置に適切な原子種を選んでクリックすると原子が追加される.原子の削除や位置調整も可能である.結合次数は自動認識されないので適切な結合次数を選んで,2つの原子を選択することで入力する.単結合は緑,2重結合は黄色,3重結合は水色で表示される.全体の編集が完了するとFigure 4のような表示となり,ダウンロードをクリックすればCMLファイルが得られる.

Figure 4.

 3D image of virtual butane model after automatic recognition and manual edition of the hydrogen atoms.

4 使用例

開発したソフトウェアによって,実体分子モデルから3次元分子構造ファイルを生成し,その再現性・正確性を二面角の差(実体モデルと仮想モデル二面角の差)を指標として検証した.最初に単結合のみからなるブタンでの検証を行い.次に二重結合とヘテロ原子を含むトリグリシン,最後に環構造を有するシクロヘキシルエーテルでの検証を行った.

4.1 ブタン

ブタンの実体分子モデルを撮影した24枚の画像群をもとに仮想分子モデルを作成し,作成した仮想分子モデルから3次元構造ファイルを取得した.得られた構造ファイルをAvogadro [8]で画像化したものをFigure 5に示す.

Figure 5.

 Butane model visualized with Avogadro based on a CML file originated from a real molecular model assembled by using the molecular model kit. Note that the 2D chemical formula shows the dihedral angle for evaluation.

仮想モデル構築に用いた画像群から求めた二面角(構造式の青色部分)は177.9700°だった.一方,3次元再構成を経て得たCMLファイルをAvogadroで表示して二面角を算出したところ175.5007°だった.したがって,二面角の誤差は1.4%であり,高い精度での再構成が行われたことがわかった.

4.2 トリグリシン

トリグリシンについても24枚の画像からの仮想分子モデル化を行った.最終的に得られた分子モデルを Figure 6に示す.

Figure 6.

 Triglycine model visualized with Avogadro based on a CML file originated from a model assembled by using the molecular model kit. Note that the 2D chemical formula shows the dihedral angles for evaluation.

再現性の検証は二重結合とヘテロ原子の組み合わせに着目して下記のように行った.構造式(Figure 6右下)の青色部分の二面角については,撮影画像では60.2798°,3D画像化を経て作成した仮想分子モデル(Figure 6)では66.8053°であり,誤差は9.8%だった.黄色部分の二面角については,撮影画像で90.9342°,Figure 6の仮想分子モデルでは95.5219°であり,誤差は4.8%だった.さらに赤色部分の二面角では,撮影画像では70.4094°,仮想分子モデルでは70.3459°と算出され,誤差はわずか0.1%だった.このように,3種の原子から構成され2重結合も含まれるトリグリシンでも高精度で仮想分子モデルへの変換が可能であることが示された.

4.3 シクロヘキシルエーテル

シクロヘキシルエーテルについては27枚の画像からの仮想分子モデル化を行った(Figure 7).

Figure 7.

 Cyclohexylether model visualized with Avogadro based on a CML file originated from a model assembled by using the molecular model kit. Note that the 2D chemical formula shows the dihedral angles for evaluation.

エーテル結合に関する二面角に着目し,下記のように再現性を検証した.構造式の青色部分の二面角については,撮影画像では73.6269°,Figure 7の仮想分子モデルでは73.0734°であり,誤差は0.8%だった.赤色部分の二面角については, 撮影画像で128. 9871°だったのに対して仮想分子モデルでは131.7560°であり,誤差は2.1%だった.このように,環構造を有する分子でも正確な仮想モデルへの変換が可能であることが明らかとなった.

5 計算例

トリグリシンを例として,開発したソフトウェアの有用性を確認すべく,本ソフトウェアを活用して実体分子モデルより取得した3次元構造ファイルを初期構造ファイルとする量子化学計算を試みた(Figure 8).

Figure 8.

 Initial triglycine model originated from the molecular model kit (a), optimized conformer obtained with Open Banel (b), and stable conformer exhibited by quantum chemistry calculation (c).

実体分子モデルから得たCMLファイルをAvogadroで表示したものがFigure 8aである.これを初期構造としてOpen Bable [9] version2.4.1による構造最適化(10000 step)を行った(Figure 8b).つぎに,オープンソースの量子化学計算ソフトウェアであるSMASH [10]で安定構造を求めた(Figure 8c).このように,通常のCMLファイルを用いた場合と全く同じように,構造最適化から量子化学計算までの一連の計算作業を滞りなく進めることができた.したがって,開発したソフトウェアを用いれば従来よりも手軽に任意の分子の安定構造を実体分子モデルから求めることが可能であることが示された.

6 総括

本ソフトウェアにより,任意の実体分子モデルを計算化学的解析に導くことが可能となった.本ソフトウェアは,実体分子モデルの2次元画像データから仮想分子モデルと対応する初期構造ファイル(三次元構造ファイル)を構築し,分子シミュレーション等の計算化学的解析へと導く新しいツールである.計算化学の初学者であっても過負荷を感じずに計算化学を実行でき,その流れや重要性を理解するうえで有効と思われる. 本ソフトウェアを用いるにあたって肝要なのは仮想分子モデルの構築に用いる画像群の質と量である.画像数が多いほど,得られる実体モデルと仮想分子モデルの誤差は少なくなるが,画像数に応じて仮想分子モデル構築に要する計算負荷は増大し,計算に要する時間もそれに応じて長くなる.本研究で取り上げた程度の大きさの分子であれば,15-25程度の画像数が適当との結論に試行錯誤を経て至った.

本ソフトウェアは原子種としてH, C, N, Oを選択できるHGS分子構造模型Aセットを対象として開発したため,このキットで作成可能な(H, C, N, Oで構成される)分子モデルの三次元構造ファイルの生成は可能である.初学者が扱うであろう単純な分子であれば対応できると考えられる.しかし大きく複雑な分子の場合,仮想分子モデル構築に必要な画像数は25枚を上回ならざるを得ず,何らかの工夫が必要である.一つの方策として,モデルの部分(例えば中央部と末端部)ごとに25枚程度の画像群を作成して部分的な仮想分子モデルとした後に,各部分の3D画像をモデリングソフトで結合させるという作業手順が考えられる.この方法を用いれば,工夫次第で複数分子の会合・相互作用状態をも仮想分子モデル化することができると思われる.また前述のように,本研究で用いたのは原子がH, C, N, O の4種類に限定されているHGS分子構造模型Aセットである.これらの原子種以外にSi, P, S, Clなどの原子を含む複雑な分子モデルの作成には, HGS分子構造模型BセットないしCセットを用いる必要がある.しかし,現状のソフトウェアはBセットおよびCセットのみに含まれる原子種に対する原子自動判定機能を備えていない.適用範囲を広げ実用性向上を図るには,この機能をソフトウェアに追加しなければならない.こうした機能拡張が今後のアップグレードを目指した開発指針の一つである. HGS分子構造模型以外のキット,例えばモルタロウを用いて作成した実体分子モデルに対する自動認識は具備していない.しかし,3次元像の構築自体には支障はなく,構築後に原子と結合の種類を指定すれば実体分子モデルを計算化学へと導くことが可能である.

本ソフトウェアはweb (http://mm2cml.mol-processing.com/)で公開中である.なお,トップページには背景に適したパターンを表示してあり,紙に印刷すれば背景として用いることができるように配慮してある.また,仮想分子モデル構築には時間を要するため,ソフトウェア一式を含めた仮想マシンのイメージの配布も検討している.

参考文献
 
© 2020 日本コンピュータ化学会
feedback
Top