Journal of Computer Chemistry, Japan
Online ISSN : 1347-3824
Print ISSN : 1347-1767
ISSN-L : 1347-1767
研究論文
量子化学計算による植物が生産するUV-B防御物質の物性値予測
桑畑 和明佐久間 柚衣川島 雪生福島 敦史長嶋 雲兵草野 都立川 仁典
著者情報
ジャーナル フリー HTML

2019 年 18 巻 2 号 p. 108-114

詳細
Abstract

植物は自らがおかれた環境に適応するため,様々な防御物質を生産する.このような環境ストレスに関する防御物質の中で,二次代謝物は植物種により多種多様な化合物構造を有することが知られている.しかし,その重要性を解明するために必要な化合物に関する物性情報は,文献から得られる実測値が大部分である.さらに,これらはアナログデータが多くを占めることから,人手による文献検索により収集せざるを得ないのが現状である.本作業には膨大な時間がかかるため,これにとって代わる化合物物性予測法の開発が急務である.一方,量子化学計算を用いることにより化合物の構造情報から物性値を予測することが可能である.しかしながら,代謝物の実測値を予測するために,どの程度の計算精度が必要かという点に関しては十分な情報が得られていない.よって本研究では,植物二次代謝物が示す物性の実測値予測の精度向上のための計算手法を開発することを目的とした.植物二次代謝物は共役系を有する分子が多いため,紫外可視吸収スペクトル (UVスペクトル) はそれぞれの二次代謝物有する化学構造と相関性を示すことが知られている.このことから,二次代謝物が有する特徴量としてUVスペクトルデータに着目した.植物科学研究で用いられるモデル植物のひとつであるシロイヌナズナが生産する二次代謝物群のうち,紫外線ストレス条件下で蓄積する代表的な防御物質6種類に対し,半経験的分子軌道計算で物性予測値を得た.さらに,筆者らが補正を加えることによって求めたUVスペクトルの吸収極大値を文献の実測値と比較した.その結果,本研究で開発した手法は多大な計算能力を必要とせず,各化合物における紫外可視吸収極大波長の実測値を十分予測可能であることが判明した.以上のことから,本手法は,植物二次代謝物の化合物情報が入手できれば簡便に物性予測が可能であると考えられる.

1 はじめに

植物は動物と異なり,自らがおかれた環境から移動することができない.しかしながら,植物は進化の過程において,乾燥,温度変化,光強度,土壌環境など,周りを取り巻く過酷な環境下を生き抜く防御機構の一つとして,二次代謝物の一種であるフェニルプロパノイドをはじめとする抗酸化物質を生産する能力を獲得してきた [1].現在,これらの環境ストレスに対抗する植物特有のシステムを理解するための解明が世界中で行われている.

植物が受ける環境ストレスの中で,太陽光に含まれる波長の短い紫外線B (UV-B, 280-320 nm)は,DNA損傷を引き起こす等,動植物の細胞に極めて大きな障害を与える [2].UV-Bに対抗する防御物質として,Figure 1に示す通り,様々な物理化学的性質を有する化合物が生産される.この中で,フェノール基を有するシナピン酸類やアントシアニン類は,強い抗酸化活性能をもち,核酸の光損傷を阻害することが知られている [3, 4].植物の中でゲノムサイズが最小であるため,モデル植物として用いられてきたシロイヌナズナ (Arabidopsis thaliana) に対して,筆者らは過去にUV-Bを短期間および長期間照射した際に生産される代謝物を網羅的に捉えることができるメタボロ―ム解析を行った.その結果,フェノール基を有する化合物や特定の化合物修飾を受けたシナピン酸類およびアントシアニン類が本条件下で特異的に高蓄積することを見出した [5].

Figure 1.

 Typical examples of secondary metabolite which was produced by Arabidopsis thaliana under UV-B stress conditions. Anthocyanin is the glycoside of anthocyanidin. It is often modified by organic acids.

植物が生産する代謝物の中で,メタボロ―ム解析により検出可能な化合物の網羅性を視覚化するため,筆者らは,主要作物であるトマト,イネおよびダイズが生産する代謝物群の物理化学的性質 (例. 分子量,蒸気圧および極性表面積等) を利用し,有機化合物の多様性についてデータベース内の網羅率を評価した [6,7,8].その結果,各植物種について,有機化合物のケミカルスペースがそれぞれの植物において,データベース内の約90%をカバーしていることを明らかにした.このような試みは,筆者らが世界で初めて行ったことであるが,植物を対象にする故の問題に直面した.植物が生産する防御物質の物理化学的性質を記述するための要素は,現在利用可能な化合物データベースで入手することが可能な18種類の情報に限られている.植物が生産する二次代謝物はそれらの情報を得ることが困難であるのに加え,イオン性を示さない中性の化合物が多数を占めるため,網羅性の達成度評価については偏りがあるのが現状である.

一方,近年の量子化学計算および計算機環境の飛躍的な発展により,幅広い分野で量子化学計算が用いられるようになった.現在では生体分子の大規模計算も現実的となり,例えば抗酸化作用の解明等,生物が有するシステムの理解が試みられている [9, 10].量子化学計算では,量子力学に基づいて電子状態を記述することができ,電荷分布や,安定構造の予測を可能とする.有機化合物の物理化学的性質として,天然物化学による構造決定の必須情報であるUVスペクトル,赤外スペクトル,核磁気共鳴スペクトルを,化学構造から算出することが可能である.化合物の構造情報は量子計算学的アプローチにより一義に決定できるため,筆者らは植物が生産する二次代謝物の化学構造式と量子化学計算による物性値予測を組み合わせることで,化合構造情報の詳細な特徴づけに利用できるのではという着想に至った.しかし,いわゆるab initio分子軌道計算を用いると,計算コストが莫大であるというデメリットがある.そのため,我々が対象としようとする大規模分子においては,半経験的分子軌道計算を用いるのが現実的であると考えた.

本研究では,アントシアニン類を含む6種のUV-B防御物質について,半経験的分子軌道計算によって求めたUVスペクトルおよび文献より得た実測値を比較した.その結果,筆者らが改良を加えた補正により,多大な計算能力を必要とせずに実測値を十分予測可能であることを明らかにした.

2 計算方法

2.1 計算詳細

全ての計算にはMOPACプログラム [11]を用いた.作成した初期構造を,PM3法(Parametric Method 3) [12]を用いて最適化した.構造最適化の際に"MMOK","PRECIS"キーワードにより分子力学補正を加え,収束条件をデフォルトより100倍厳しくした.最適化した構造で振動計算を実施することにより,振動数は全て正であり,安定構造であることを確認した.次に,得られた構造を用いて,CNDO/S法 [13]の一点計算により30個の励起状態を計算し,波長と振動子強度を求めた.

2.2 計算した化合物

本研究では,植物が生産するUV-B防御物質の中で,実験においてUVスペクトルが報告されているSinapic acid,Quercetin,Kaempferol,Cyanidin-3-glucoside,Anthocyanin (A) 3*,A11*の6種類の分子の光吸収スペクトルを計算した.Figure 2に本研究で用いる分子構造を示す.

Figure 2.

 Products calculated in this study.

*略語説明

A3, cyanidin 3-O-[2-O(xylosyl)-6-O(p-coumaroyl) glucoside] 5-O-glucoside, A11, cyanidin 3-O-[2-O(2-(sinapoyl) xylosyl)-6-O(4 (glucosyl)p-coumaroyl) glucoside] 5-O-[6-(malonyl) glucoside]

3 結果と考察

PM3法により最適化した構造をFigure 3に示す.Sinapic acid,Kaempferol,Quercetinはフェノール基に対してほぼ平面構造となるのに対し,Cyanidin-3-glucosideはナフチル基とカテコール基が約30°回転した構造になった.またA3およびA11はこれらの置換基がアントシアニジン骨格に覆いかぶさる構造となった.

Figure 3.

 Molecular structures optimized by PM3 method.

次にこの最適化構造を用いて,CNDO/S法により吸収波長および振動子強度 f を30個求めた.求めた計算値のうち,振動子強度が大きい5つの励起状態をTable 1に示す.

Table 1.  Maximum absorption wavelengths and oscillator strengths in the top 5 in order of the oscillator strength which were calculated by CNDO/S method.
Molecule 1 2 3 4 5
Sinapic acid oscillator 0.896 0.471 0.377 0.361 0.182
wavelength 285.3 192.3 222.8 201.6 189.7
Kaempferol oscillator 1.021 0.791 0.759 0.434 0.358
wavelength 191.3 317.1 198.8 195.0 171.8
Queretin oscillator 1.300 1.034 0.786 0.284 0.254
wavelength 194.5 200.6 316.9 174.3 255.9
Cyanidin-3- oscillator 1.053 0.847 0.432 0.383 0.247
glucoside wavelength 191.5 420.0 189.8 211.6 188.7
A3 oscillator 1.077 0.961 0.754 0.617 0.416
wavelength 285.4 414.1 198.6 210.9 212.2
A11 oscillator 0.935 0.921 0.883 0.589 0.317
wavelength 285.3 406.7 289.5 211.1 248.8

実験で得られる吸収スペクトルとの比較のために,量子化学計算で得られたfをモル吸光係数に変換する.定義よりfは以下の関係にある.   

f = 4 m e c 2 ϵ 0 N A e 2 ln 10 ν 1 ν 2 d ν ϵ ( ν ) (1)

ここで,meは電子の静止質量,cは光速,0は真空の誘電率,NAはアボガドロ定数,eは電気素量,vは波数である.をガウス型関数と仮定して以下のように置く.   

ϵ ( ν ) = N e α ( ν ν ) 2 (2)

ここで,v’は光学遷移のおこる波数であり,Nαの形状を特徴付ける定数である.これを式(1)に代入すると,   

d ν ϵ ( ν ) = N π α = N A e 2 f 4 m e c 2 ϵ 0 ln 10 (3)
となる.に含まれる定数の個数を減らすために,半値幅Δvを導入する.定義より   
ϵ ( ν ± Δ ν 2 ) = N 2 (4)
であり,これを式(2)に代入して   
α = 4 ln 2 ( Δ ν ) 2 (5)
を得る.これを式(3)に代入すると,   
N = N A e 2 f 2 m e c 2 ϵ 0 ln 10 Δ ν ln 2 π (6)
となる.式(5),(6)を式(2)に代入すると,   
ϵ ( ν ) = N A e 2 f 2 m e c 2 ϵ 0 ln 10 Δν ln 2 π exp [ 4 ln 2 ( ν ν Δν ) 2   ]
となる.これに N A などの定数に値を代入して以下のように成る.   
ϵ ( ν ) = f × 2.175 × 10 8 Δ ν exp [ 2.772 ( ν ν Δ ν ) 2   ] (7)
以下の計算では,Δvは実験で得られた吸収ピークの本数と同じになるように,Δv = 4000cm−1を用いた.Table 1で示すような量子化学計算で得られたfおよびv’を式(7)に代入し,横軸を波長に変換したものをFigure 4に示す.図より各分子は2つ,または3つの吸収ピークを持つことが判明した.

Figure 4.

 Absorption spectrums of each product calculated by equation (1).

Figure 4よりSinapic acid,Quercetin,Kaempferol,Cyanidin-3-glucosideには2つのピーク,A3とA11には3つのピークがあることがわかる.大まかな傾向としてはSinapic acid,Quercetin,Kaempferol などの小さな分子は350 nm以下の短い波長に吸収があり,Cyanidin-3-glucoside,A1,A11などの大きな分子には最大400 nm以上の長い波長にまで吸収ピークがある.Figure 4 の各スペクトルにおける吸収極大波長,および実験値を載せたものをTable 2に示す.

Table 2.  Maximum absorption wavelengths (nm) of absorption spectra in Figure4 and corresponding experimental values.
Calc. Exp. Reference
Sinapic acid 195.3 229 [14]
285.2 312
Kaempferol 193.9 266 [15]
316.5 366
Cyanidin-3- 190.9 273 [16]
glucoside 419.3 536
Quercetin 195.9 256 [15]
316.0 374
A3 204.9 312 [17]
281.9 440
413.8 524
A11 216.4 284 [18]
284.9 296
405.6 539

Table 2における計算で求めた各分子の最長波長は,Sinapic acidの283.5 nmが最も短く,励起エネルギーが最も大きいことが明らかとなった.続いて,Kaempferol,Quercetinはそれぞれ314.8,315.3 nmを吸収極大に持ち,Cyanidin-3-glucoside,A3,A11などのCyanidin類は約400 nmであると算出された.この大小関係は定性的に実験値と一致した.

Sinapic acid,Cyanidin-3-glucoside,Kaempferol,Quercetinにおける長波長側の励起状態の帰属を解析したところ,HOMOとLUMO間の遷移であるπ-π*遷移であることがわかった.各分子のHOMO,LUMO軌道をFigure 5に示す.一般的に半経験的分子軌道法は,一重項のπ-π*遷移の再現性が高いことが報告されている [19].一方,長波長側ではA3の計算値における2番目の吸収ピークが281.2 nmに対して,実測値では440 nmと吸収ピーク波長が乖離した.

Figure 5.

 HOMO and LUMO of each product. The difference of colors shows the difference of phase in molecular orbitals.

そこで計算で求めた吸収ピークの値と実測値のずれを補正するため,Table 2で示した計算における吸収波長を横軸,文献値で示された吸収波長を縦軸に表した(Figure 6).図中の点線はプロットを比例関数でフィッティングしたものであり,傾きは約1.27,相関係数は約0.87であった.相関係数は1に近い値を示し,計算と実測値は強い相関があることが明らかとなった.また,直線の傾きが約1.27であることから,計算で求めた吸収極大波長に1.27をかけることで実験値に近い値を推察できると考えられる.

Figure 6.

 Correlation between calculated maximum absorption wavelengths and experimental values, as shown in Table 2.

今回予測に用いたUV-B防御物質の中で,A3およびA11等のアントシアニン類の化学構造は,アントシアニジンを母核として,糖やSinapic acidなどが置換基として修飾され (配糖化およびアシル化),植物細胞内に蓄積されることが知られている [20].これまで,シロイヌナズナを中心として,アントシアニン生合成経路に関する遺伝子同定が進められてきた [21].アントシアニン類はSinapic acid 等とは異なり,フェノール基に対して平面構造を取らないことが,本研究で明らかとなった.この立体構造の特異性が,アントシアニン類の修飾様式の多様性と関連する可能性が考えられる.

4 結論

多種多様な植物代謝物の化学構造を同定には,物性を測定あるいは物質を同定・定量するための各種分光法によりスペクトルデータが利用されてきた.その中で,赤外分光法や核磁気共鳴分光法はスペクトルデータの完全一致を化学構造の同定とみなすのに対し,紫外分光法は共役系を有する化学構造と相関関係の妥当性を示すのに用いられる.すでに数千以上の植物二次代謝物が同定されてきたため,天然物化学者は化学構造情報を記述する分光スペクトルデータすべて用いるのではなく,フォトダイオードアレイ検出器で得たUVスペクトルデータのみを,質量分析計から得られる質量電荷比の開裂パターンによって構成されるマススペクトルやそれそれの機器の測定条件と併せ,実測値として文献に記載することが多い.よって,本研究では分光スペクトルデータの代表としてUVスペクトルデータに着目し,実験的にUVスペクトルが測定されているUV-B防御物質6種類について,量子化学計算による物性値と文献の実験値とを比較した.アントシアニン生合成経路の出発物質であるCyanidin-3-glucosideおよび安定的に検出されるアントシアニンとして,A3およびA11,アントシアニンの配糖化に関連するSinapic acidおよびフラボノールの一種であるKaempferol およびQuercetinを標的分子とした.半経験的分子軌道計算であるPM3法を用いてこれらの分子の構造最適化を行い,得られた構造でCNDO/S法により励起状態計算を行った.算出された励起エネルギーを補正することにより,実験値と強い相関があることを明らかにした.

文献に取り上げられているQuercetinをはじめとする多くの重要二次代謝物の実験値はデジタル化されていないことから,量子化学計算による予測は,今後の植物科学の発展に大きく寄与すると考えられる.筆者の研究室が保有するワークステーションを用いた計算例では,高精度な第一原理計算であるTD-DFTによるFigure 2に挙げた研究対象化合物の計算時間は数十分から1時間以上であった.一方,本研究で採用した半経験的分子軌道法なら数秒で計算が完了した.本研究では,このように計算資源を大幅に節約しつつも半経験的分子軌道計算法からの推察する一つの手法を示し,実験値の吸収極大波長を予想することに成功した.

今後は,植物が生産する多様な二次代謝物を対象に量子化学計算で得られた吸収極大波長の大量のデータセットを機械学習で適切に処理し,ニューラルネットワークなどの情報科学的な手法を用いて実験値を精度よく近似する.それにより,実測値を取得することが困難である様々な有用代謝物の物理化学的情報を高解像度で得る技術につなげることが大いに期待できる.

謝辞

本研究は,筑波大学平成28年度国立大学法人運営費交付事業「フードセキュリティー実現のための循環型研究拠点の構築」によって実施した.

参考文献
 
© 2019 日本コンピュータ化学会
feedback
Top