農研機構研究報告
Online ISSN : 2434-9909
Print ISSN : 2434-9895
ISSN-L : 2434-9895
原著論文
オープン・クローズ戦略に沿った 農研機構食品機能性成分統合データベースの開発と公開
桂樹 哲雄 森 翔太郎十一 浩典石川(高野) 祐子小林 暁雄伊藤 研悟山本(前田) 万里川村 隆浩
著者情報
研究報告書・技術報告書 フリー HTML

2023 年 2023 巻 13 号 p. 47-61

詳細
Abstract

農研機構では,2012-2015 年度に実施した機能性農林水産物・食品開発プロジェクトの成果物を元に,農作水産物が持つ機能性成分について文献情報と共に整理し,「機能性成分・評価情報データベース」として 2018 年より公開している.一方,2019 年から,農研機構は島津製作所と共同で「食品機能性成分解析共同研究ラボ(NARO 島津ラボ)」を設置し,機能性農林水産物に関する様々な分析を実施してきた.また,農研機構内には戦略的イノベーション創造プログラム第 2 期「スマートバイオ産業・農業基盤技術」(SIP2)の分析データも存在する.このたび農研機構では,機構内で得られた食品機能性成分データを一か所に集める狙いから,「機能性成分・評価情報データベース」,「NARO 島津ラボ」のデータ,SIP2 の成果等を集約し,「農研機構食品機能性成分統合データベース」を開発した.収録するデータには,公開情報だけでなく閲覧者を制限すべきクローズドデータが含まれるため,柔軟なユーザ認証機能を導入し,適切なアクセス管理を行えるようにした点に特徴がある.本データベースでは,データの属性に応じて検索結果をグループ化して表示するファセット検索機能やグラフ表示機能などを実装した.

はじめに

「国民の健康の増進の総合的な推進を図るための基本的な方針」(平成 24 年厚生労働省告示第 430 号)によると,健康寿命は,「健康上の問題で日常生活が制限されることなく生活できる期間」とされる.令和 2 年度版厚生労働白書を見ると,ここ数十年の間で日本人の平均寿命と健康寿命は共に延伸しているが,これらの間には依然 10 年程度の差があり,この差を縮めるために生活習慣病をはじめとした疾病の予防に対する関心が高まっている.厚生労働省が 2011 年より実施し,現在も継続している「スマート・ライフ・プロジェクト」(厚生労働省 2011)でも提案されている通り,生活習慣病を予防し健康寿命を延ばすためには,適度な運動,適切な食生活,禁煙が推奨されるが,近年においては特に食による健康維持・増進の観点から,食品の機能性に注目が集まっている.食品の機能は主に3つに分類される(表 1).第 1 次機能として,栄養に関する機能(タンパク質,脂質,炭水化物,無機質,ビタミンなどの生命の維持に必要な栄養素やエネルギーを供給する機能),第 2 次機能として,感覚・嗜好に関する機能(色,味,香りや,口当たり,歯ごたえ,のど越しといったテクスチャーなど,おいしさを感じさせる機能),第 3 次機能として,生体調節に関する機能(疾病の予防,生体調節・防御機能)である.狭義の食品機能性と言う場合には,3 次機能のことを指すことが多い.巷にはいわゆる「健康食品」があふれているが,食品の中で機能性を表示できるのは,国の制度によって特定の機能の表示などができる保健機能食品だけである.保健機能食品は,さらに特定保健用食品(個別許可制),栄養機能食品(規格基準型),機能性表示食品(届出制)の3つに分類できる(図 1).機能性食品表示制度は,保健機能食品の 3 つの分類の中で最も後発で,2015 年 4 月に始まった(消費者庁 2015).それまで機能性を表示できる食品は,国が個別に許可した特定保用食品(トクホ)と国の規格基準に適合した栄養機能食品に限られていた.ただ,前者は臨床試験費用や許可までの時間,表示の自由度といった点が,後者は成分の種類や表示できる範囲がその名の通り第 1 次機能に制限されている点が,それぞれ課題であった.機能性食品表示制度はこれらを受け,事業者の責任で食品の機能性と機能性に関する科学的根拠などの情報を販売前に消費者庁に届け出ることで機能性を表示することを可能とした制度である.販売前に届け出る必要があるものの,特定保健用食品とは異なり,消費者庁の審査・許可は不要であり,対象も広く,容器包装に入れられた一般用加工食品だけでなく,生鮮食品も対象となっている.消費者にとっては,製品に含まれる機能に着目して商品を選べること,またその機能の根拠となる資料を取得し,自ら判断することが可能であることが利点であり,販売する事業者にとっては,他の製品との差別化ができ,高付加価値によって消費者にアピールできることが利点である.

農研機構では,病害虫抵抗性,対候性,食味改善だけではなく,早くから食品の機能性に着目して様々な農作物を開発してきた.2018 年度には,農林水産物の機能をその有効性を科学的に示すエビデンスデータとともに整理し,「機能性成分・評価情報データベース」(農研機構 2018)として公開した.また,2019 年度に農研機構と島津製作所が共同で立ち上げた「NARO 島津ラボ」や戦略的イノベーション創造プログラム第 2 期「スマートバイオ産業・農業基盤技術」(SIP2)等により,機能性成分に着目した様々なデータを取得・蓄積してきた.前者のデータは食品に含まれる成分とその機能とをつなげる情報を含む一方,後者のデータは後述の通り主に育種現場における化合物のスクリーニング結果や定量測定の結果であるため,そのままでは食品の機能と結びつけることができない.両者のデータを組み合わせることで,育種研究者は測定結果を食品の機能と結びつけて考えられるようになる.そこで,これらのデータを集約・統合し,「農研機構食品機能性成分統合データベース」を開発・公開した.本稿では,まず,「機能性成分・評価情報データベース」,および,農研機構が島津製作所と共に立ち上げた「NARO 島津ラボ」,および SIP2 プロジェクトの概要とそこから取得されるデータについて紹介し,その後,「農研機構食品機能性成分統合データベース」の機能について詳説する.

1.農林水産物の機能性成分・評価情報データベース

我が国の農林水産物の品質の高さ,種類・品種の多様さ,安全性は世界屈指の水準であり,その中には健康を維持・増進する作用(生体調節機能)が期待される農林水産物も数多くある.農研機構では,以前から,メチル化カテキンを多く含む緑茶「べにふうき」(Sano et al. 1999),β-グルカンを多く含む大麦「きらりもち」(Yanagisawa et al. 2011) ,ケルセチンを多く含むタマネギ「クエルゴールド」(Muro et al. 2015) など,いくつかの機能性成分をもつ農作物を作出してきた(山本(前田) 2017).一方,このような食品機能性成分には生活習慣病発症リスクの低減,認知機能の維持や精神的ストレスの緩和等の作用があると言われているものの,消費者のニーズに応えて適切な食品や栄養指導を行うための情報の提供は充分とは言えなかった.そこで,農研機構では,産官学様々な機関との連携により,個人の健康状態に応じた栄養指導の支援を目指し,農林水産物やその加工品が含有する栄養成分や機能性成分の分析値,また農研機構で作成した機能性表示に利用可能な研究レビュー(システマティックレビュー:SR)を「機能性・食事バランスデータベース」として 2015 年から公開した.さらに,疾病リスク低減への影響等の生態調節作用に関する特性情報,そのエビデンスとなる文献情報,安全性に関する情報を整理した上で,農林水産省委託プロジェクト研究「市場開拓に向けた取組を支える研究開発」のうち 「地域の農林水産物・食品の機能性発掘のための研究開発」(実施期間 H 28~R 2)において取得されたデータを追加し,2018 年度より「機能性成分・評価情報データベース」として公開してきた.このデータベースが提供する健康維持・増進に関する農林水産物の機能性関連情報には,管理栄養士が個人の健康状態に合わせて食事管理をする際に利用しやすくするため,前身 DB と同様に日本食品標準成分表(文部科学省 2020)と同じ食品番号が付与されている.

2.NARO島津ラボ

上述のように機能性成分に対する注目が集まる中で,2015 年 4 月の機能性表示食品制度の開始が一つの契機となり,地域特産物の健康機能性を解明し,付加価値を付けることで市場拡大,地域の活性に役立てたいという農業・食品現場のニーズが高まってきた.また,世界的にもヘルスケア市場が急速に拡大する中,食品機能性成分に関する情報の蓄積がますます重要となっている.このような状況を受け,農研機構と島津製作所は 2019 年 8 月に「食」の機能性成分解析を目的として,食品機能性解析共同研究ラボ(以下 NARO 島津ラボ)を立ち上げた.NARO 島津ラボには主に二つの目的がある.一つは,これまで圧倒的に不足していた機能性農作物に関する科学的エビデンスの収集を目指し,農研機構が持つ履歴の明らかな農作物と島津製作所が持つ最新の分析技術を組み合わせて機能性成分データを蓄積することで,今後の育種(品種開発)の現場における有望品目・系統の選択に役立てることである.特に農研機構が保有する農作物の品種,系統を中心に機能性成分データを蓄積・整理する.もう一つは,分析対象成分それぞれの分析手法を確立することである.分析手法の開発に当たっては,利用が容易であることを目指し,JAS 規格などの公的機関が公開している分析方法を基本とし,既存の分析機器を組み合わせたものかつ可能な限り簡易な方法を開発する.開発した手法はメソッドパッケージとして島津製作所より上市することを目指している.

NARO 島津ラボでは,食品機能性成分に関するデータ駆動型育種を見据えた以下のような一連の分析作業を実施できる.まず対象の農作物・食品に対するノンターゲット分析を実施し,各試料における機能性成分のスクリーニングを行う.そこから候補となる成分を絞ってワイドターゲット分析,および既知の濃度の対象成分を含む試料から作成した検量線を用いたターゲット分析を実施する.これにより目的の成分のデータを得て,当該成分をより多く含有する品種候補や,既存農作物を代替できる品種候補を見つける,という作業である.すでに液体クロマトグラフ四重極飛行時間型質量分析計(LC-QTOF-MS)によるノンターゲット分析,液体クロマトグラフ四重極型質量分析計(LC-TQ-MS) , ガスクロマトグラフ質量分析計(GC-MS)によるワイドターゲット分析,高速液体クロマトグラフ(HPLC), GC-MS によるターゲット分析の手法を確立し,さまざまな農作物に対する分析データを蓄積してきた(表 2).

3.戦略的イノベーション創造プログラム等による機能性成分の研究

SIP2 の課題「健康寿命の延伸を図る「食」を通じた新たな健康システムの確立」において,日本食を構成する 32 食品についてのターゲット分析を実施した.また,2019 年から開始した COI-NEXT 研究成果展開事業 共創の場形成支援プログラム「つくば型デジタルバイオエコノミー社会形成の国際拠点」において,豆類,雑穀類を対象としたワイドターゲット分析を実施した.

農研機構食品機能性成分統合データベースの開発

農研機構では,データ駆動型農業・食品研究開発を促進するために,2020 年度より機構内の農業・食品関連データを整理して登録するための統合的なデータベース(農研機構統合 DB)を開発・運用している(川村ら 2021).農研機構統合 DB は,データカタログとしてデータセットにメタデータを付けて整備した 1 次 DB と,1 次 DB に格納されたデータセットのうち,データセット間で連携が可能なデータを,いわゆる表形式のデータや,ノード(頂点)とエッジ(辺)を用いてデータの関連性を表すグラフ DB に変換して格納した 2 次 DB とに分けられる.

これまで述べてきた機能性成分データ・評価情報データベースに格納されたデータおよび NARO 島津ラボ,SIP2 等において取得されるデータは,いずれも農研機構が中心となり取得した農林水産物・食品に関する栄養・機能性成分のデータであり,これらのデータセットを整理し,1 つのデータベースに格納すれば,前述のようにデータベース内で成分と機能性を結び付けて解析することや,ゲノム情報,栽培情報などの他のデータセットと連携することで利用価値が高まると考えられる.そこで,これらのデータを整理・統合し,農研機構統合 DB の 2 次 DB の 1 つと位置付けて「農研機構食品機能性成分統合データベース」を開発した.

1.データの統合と登録

データを統合するにあたっては,それぞれのデータの出所が異なることから,同じ化合物であっても必ずしも名前が一致しない問題があった.これを解決するには,同じ化合物であれば同じ ID と紐づく仕組みを導入する必要があった.この目的で一般的によく使われるのが InChI および,それをハッシュ化した InChIKey である(Goodman et al. 2021).InChI は,国際純正・応用化学連合(International Union of Pure and Applied Chemistry, IUPAC)が開発した,機械読み取り可能でかつ人間が読める分子情報を提供する構造記述子であり,化合物の構造から機械的に生成できる標準的な識別子の一つである.InChIKey は検索が容易となるように,InChI から生成された固定長(27 文字)のハッシュ表現である.InChIKey はハッシュ表現であるために,ある InChI からは必ず同じ InChIKey が生成されるものの,逆は真ではなく,極稀に異なる InChI から同じInChIKeyが生成されることがあるが,本データベースでは固定長である利点を考慮し,化合物の ID としてInChIKeyを用いた.収録する全ての化合物について,InChIKeyを取得・生成し,InChIKey を主キーとして対応する化合物の情報を整理した.InChIKey は,日本化学物質辞書(木村,櫛田 2015),PubChem(National Institute of Health 2021),CAS Common Chemistry(Jacobs et al. 2022)を用いて取得し,これらにより取得できなかったものについては手動で生成した.

2.データベースの機能

本データベースは,既存の「機能性成分データ・評価情報データベース」から以下の全ての機能を継承し,前身 DB と同様に一部のデータを除き農研機構外部にも広く公開することとした.

・農林水産物の品目から機能性成分を検索

・目的とする機能から機能性成分を検索

・農研機構で育成された機能性農林水産物に関する成果情報検索

・農研機構が実施したシステマティックレビュー(SR)を表示

・フリーワード検索(機能性成分)

一方,NARO島津ラボ等において取得されたデータについては,以下の機能を実装した.

・ノンターゲット分析結果の RT vs m/z 表示

・ノンターゲット分析結果における品種間のばらつきによるブラウズ

・ノンターゲット分析結果における化合物ごとの品種間のばらつきの表示

・ワイドターゲット分析・ターゲット分析結果のグラフ表示,テーブル表示

これらのデータには適切なアクセスコントロールを実施することで,機密性を維持しながらも必要に応じてデータを共有できる仕組みを構築した.以下に詳細を述べる.

機能性成分データ・評価情報データベース

1.収録データ

機能性成分データ・評価情報データベースに収録されていた栄養・機能性成分と,それを含有する農林水産物(231 品目),化合物の含有量(72 化合物),エビデンスとなる文献情報(479 ペア)のデータを登録した.データスキーマは前身 DB のものを踏襲した.

2.検索機能

これらのデータは,農林水産物の品目と機能から検索できる.農林水産物の品目は 10 種類のカテゴリに分類した(表 3).同様に機能の項目については5種類のカテゴリに分類し,検索時に容易に各項目を選択可能とした(表 4).データベースの使い方は,基本的にどの検索方法でも同じであり,ファセット検索機能を使って検索する.ファセット検索機能とは,ユーザがあらかじめシステムに用意された切り口(ファセット)に基づいて検索条件を選ぶことで(例えば,「品目」が「むぎ」であるものを選ぶことで),コンテンツを絞り込む機能である.左のメニューから検索方法を選び,検索したい項目を選ぶと,右側に検索結果がタイル形式で表示される(図 2).このとき,項目は複数選択できる.右側に表示された検索結果のタイルをクリックすると,さらに詳細な情報として,その化合物の構造式と,その化合物が持つ機能,エビデンスとなる文献情報,農研機構における研究成果の情報などが表示される(図 3).機能性成分データ・評価情報に格納されているデータは,一部のエビデンス情報を除いて公開情報である.それぞれの機能について述べる.

1)農林水産物の品目から機能性成分を検索

左のメニューの「農林水産物の品目から検索」に表示された 10 個のカテゴリの中から目的の農林水産物の品目のチェックボックスにチェックを入れると,右側にその農林水産物が関連する化合物と,その機能がタイル形式で表示される.図 4のように複数の農林水産物を選ぶことも可能であり,「品目を全選択」のボタンにより品目を一括で全て選択することも可能である.

2)農林水産物の品目から関連する機能性成分一覧を表示

メニュー画面から「農林水産物の品目から検索」の「選択された品目に掲載されているデータの一覧」から「品目内掲載データ一覧」を選ぶことで,それぞれの農林水産物の品目に関連するデータの一覧を表示できる(図 5).

3)目的とする機能から機能性成分を検索

左のメニューの「目的とする機能から検索」に表示された5つのカテゴリの中から目的の機能のチェックボックスにチェックを入れると,該当する機能に関連する化合物とその機能がタイル形式で表示される.「機能を全選択」ボタンにより,機能をすべて選択することも可能である(図 6).

ノンターゲット分析,ワイドターゲット分析,ターゲット分析の結果

1.NARO 島津ラボにおいて取得されたデータ

収録したデータの概要は表 2 のとおりである.NARO 島津ラボで分析対象とした農林水産物には品種登録前のものが含まれており,取得されたデータは閲覧者を制限すべきクローズドデータである.

1)ノンターゲット分析

茶試料 64 点,大麦試料 70 点に対する,LC-QTOF-MS を用いたノンターゲット分析の結果を収録した.本分析法では,試料中の各成分について,保持時間と精密質量(正イオン・負イオン)の情報セットを得ることができる.各試料から取得した多数の情報セットを専用解析ソフトウェアである「Signpost MS」を用いて整理(アラインメント)後,同一成分だと判定された情報セットをグルーピングし,これらをまとめたものを分析結果としている.LC-QTOF-MS によって得られる精密質量情報を基に分子式の推定が可能であることが最大のメリットである一方,保持時間情報が測定バッチごとにばらつく傾向があり,分析結果を測定バッチごとにまとめて登録する必要がある.

2)ワイドターゲット分析

大麦試料 70 点,米試料 26 点に含まれる香気成分に対する, GC-MS を用いたワイドターゲット分析(75 成分),および野菜試料(ピーマン 11 点,キャベツ 1 点,パプリカ 17 点,ナバナ 1 点,白菜 1 点,大根 4 点)に含まれるアミノ酸類に対する,LC-TQ-MS を用いたワイドターゲット分析(55 成分)の結果を収録した.これらのワイドターゲット分析法で測定される成分量は,確立された定量分析法と比較すると正確度が劣るが,多数の成分を一斉に測定可能であることがメリットである.得られる成分量は参考値として扱い,相対的な比較に用いる.

3)ターゲット分析

ターゲット成分の物理化学的な性質に合わせ,HPLC,GC-MS,LC-TQ-MSのいずれかを用いて行った定量分析結果を収録した.茶試料 64 点からは 93 化合物(カテキン類・フラボノール類・カロテノイド類・アントシアニン類・脂肪酸類),大麦試料 70 点からは 97 化合物(カロテノイド類・アントシアニン類・脂肪酸類・アルコール類,ステロール類),米試料 26 点からは 88 化合物(カロテノイド類・リン脂質類・脂肪酸類),大豆試料 62 点からは 18 化合物(イソフラボン類・リン脂質類・脂肪酸類)の定量値が得られ,それぞれを収録した.

2.SIP2 において取得されたデータ

1)ワイドターゲット分析

日本食を構成する一般的に流通している食品素材 32 品目を対象に LC-TQ-MSを用いたワイドターゲット分析を実施し,得られた 290 化合物(ポリフェノール類・アミノ酸類・ペプチド類・カロテノイド類・リン脂質類・一次代謝物)の成分量を収録した.食品番号と紐付けた食品素材に含まれる化合物の比較が可能となる.

3.COI-NEXT において取得されたデータ

1)ワイドターゲット分析

遺伝資源情報を基に選抜した豆試料 5 点を対象に 283 化合物(ポリフェノール類・アミノ酸類・ペプチド類・カロテノイド類・リン脂質類・一次代謝物)の含有量を,雑穀試料 11 点・茶試料1点・大豆試料 1 点を対象に 136 種類のポリフェノール類の含有量を,雑穀試料 3 点・茶試料 1 点・大豆試料 1 点を対象に 60 種類のアミノ酸類・ペプチド類の含有量を,それぞれ LC-TQ-MS を用いたワイドターゲット分析で定量した結果を収録した.

4.オープン・クローズ戦略に沿ったデータベースの外部公開

1)オープン・クローズ戦略

第 6 期科学技術・イノベーション基本計画に示される通り,公的資金による研究データは,オープン・クローズ戦略に基づき研究データの管理・利活用を行う必要がある.農研機構において産出される研究データは,その大半が公的資金によるものであることから,管理する際には組織や研究分野の特性に配慮し,適切に「公開」「共有」が判断されるべきである.ここで,研究データの「公開」とは,任意の者がアクセス可能な状態とすることを指し,「共有」とは,アクセス権を付与された者のみに限定してアクセス可能な状態とすることを指す.論文の公正性を担保するために,その根拠としての研究データは原則公開とし,その他の研究データについてもデータの利活用という観点からは可能な限り公開・共有することが望ましいとされる.一方で,研究データには我が国の安全保障や産業競争力,科学技術・学術分野における優位性に関わる機微な情報が含まれる場合があるため,必ずしもすべてのデータを公開・共有することが望ましいとは限らない.農研機構では,2019 年に研究データの取扱いに関する基本方針(データポリシー)を策定し,公益性の他,個人情報保護,安全保障,産業競争力,財産的価値などの様々な観点から,データの公開・共有を判断することとしている (Kawamura et al. 2022).本データベースにおいては,後述の通り,これらの判断に基づいて柔軟にデータの公開・共有を設定できる機能を実装した.

2)Oracle Application Express 開発基盤

本データベースは,開発基盤として Oracle Application Express (Oracle APEX,Oracle 2022) を採用した.Oracle APEX は,Oracle 社が提供する Web アプリケーションのためのローコード開発プラットフォームであり,クラウド上やオンプレミス環境などの Oracle Database が実行されている環境にデプロイ可能である.本プラットフォームは,データ定義に合わせたフォーム画面作成機能など,インタラクティブな操作が可能な画面を容易に作成できる機能を備える他,認証・認可機能にも対応している.また,多彩な分析機能を標準で搭載しており,データを棒グラフ・円グラフなどで表示することが可能である.Oracle APEX を用いて開発された Web アプリケーションは Oracle 社が開発したデータベース言語 PL/SQL をベースとしているため,開発者が手軽にカスタマイズすることも可能である.以上から,本データベースを Oracle APEX を基盤として構築することで,認証機能との統合,フォームやグラフを用いたインタラクティブな可視化操作などを比較的容易に開発できる.Oracle APEX にはアプリケーションを利用するために必要なプラットフォームをインターネット上で提供する PaaS (Platform as a Service) として Oracle APEX Application Development (Oracle APEX Service) が用意されている.PaaS を利用することで開発プラットフォーム環境の設計・準備・維持が必要なくなるため,アプリケーション開発に注力することが可能であることから,本データベースは Oracle APEX Service を用いて構築した.

3)アクセス権の制御

前述の通り,本データベースに収録するデータには,誰もがアクセスできるべき公開データだけでなく,閲覧者を制限すべきクローズドデータも含まれる.Oracle APEX では,Oracle Identity Cloud Service (Oracle IDCS) 認証基盤を利用することができる.そこで,本システムでは,Oracle IDCS を基盤とした認証・認可機能を実装した.認証機能については,標準機能をそのまま利用することにしたが,認可機能についてはデータごとに柔軟に権限設定をするために,標準機能を利用せずに,データとユーザのグループを設定するためのテーブルを作成し,それに基づいてグループ単位で権限を付与する機能を実装した.これらの権限制御により,オープン・クローズ戦略に基づいた柔軟なデータ公開・共有を実現した.

5.ノンターゲット分析,ワイドターゲット分析,ターゲット分析の結果表示

1)ノンターゲット分析結果の表示

Signpost MS によるアラインメント結果を確認したところ,同一アラインメント内でも保持時間 RT と m/z(化合物の質量を価数で除した値)にばらつきがあるものがあった.これらのばらつきの原因は主に 2 つ考えられる.1 つ目は別の化合物の結果が同じアラインメント ID に割り当てられたこと,2 つ目は同じ化合物の含有量にサンプル間(品種間)でばらつきが存在したことである.育種の際には同じ化合物に対してサンプル間の含有量のばらつきを見たいので,同じアラインメント内に異なる化合物が混入している前者は好ましくなく,後者のみを解析したい.さらに言うと,単にサンプル間のばらつきが大きいというだけでなく,サンプル間で大きな差が出ているものに着目したい.そこで,これらを直感的に区別できる新たな表示方法として,アラインメント毎のばらつきを色付きのバブルグラフによって表示することを考えた(図 7).図中縦軸は RT,横軸は m/z を表し,それぞれのバブルが 1 つのアラインメントを示す.バブルの色はそのアラインメントの中での RT, m/z のばらつき度合いを示し,青色から赤色に向けてばらつきが大きくなり,大きく外れている場合には灰色で表示した.バブルの大きさはそのアラインメントの中で算出した”最大ピーク値/最小ピーク値”の値に比例する.グラフはマウス操作による拡大,縮小が可能である.経験上,色が赤色に近い(アラインメント内のばらつき大きい)ほど,複数の化合物が同じアラインメントに割り当てられていることが多い.すなわち,色が青色に近いほど同一化合物である可能性が高くなる傾向にある.また,バブルは大きいほどサンプル間の差が大きいと期待できる.そのため,大きいバブルから詳細を調べ,同程度の大きさのバブルが2つあった場合には,より色が青色に近いものを選んで優先的に調べることで,効率よく目的の化合物候補が見つかると期待できる.

このグラフにはノンターゲット分析結果を受けてさらにターゲット分析を実施した際に利用した標準試料の分析の結果もひし形のマークとして同時に表示できる.このバブルグラフはフォームに”最大ピーク値/最小ピーク値”の上限値と下限値を指定することで表示範囲を絞り込むことが可能である.グラフの下には,当該データのテーブルが表示され,ダウンロードすることが可能である.バブルをクリックすると,図 8のようにそのアラインメントに割り当てられた品種ごとの含有量のばらつきを表示する.この画面では,”Display Alignment ID”にアラインメント ID を指定することで,表示するアラインメントを切り替えることができる.スイッチにより,全サンプルを表示するモードと値が 0 より大きいサンプルのみを表示するモードとを切り替えられる.

標準試料の分析結果がある化合物については,化合物名のリストから検索することが可能である(図9).表中の Link をクリックすると,図 10のように標準試料のノンターゲット分析(例ではエピガロカテキン)の結果が中央の星印で表され,近傍にノンターゲット分析の結果があった場合には,アラインメント毎に色分けして表示される.凡例のアラインメント名をクリックすると,当該アラインメントのデータの表示・非表示を切り替えることができる.また,表示範囲に別の標準試料の結果がある場合にはひし形で表示され(例ではガロカテキン),そのひし形をクリックするとその標準試料のデータを中心とした表示に切り替わる.図 10の画面は,図 7 のバブル表示の画面で標準試料を表すひし形をクリックしても表示することができる.

2) ワイドターゲット分析結果・ターゲット分析結果の表示

ワイドターゲット分析とターゲット分析のデータベースにおける表示方法は基本的に同じである.リストの中から表示する品目と成分を選ぶ(複数選択可)と,該当する成分の試料中濃度を化合物毎に表示する(図 11).このとき,試料中濃度はそれぞれの化合物において品目ごとに並んで表示されるため,当該成分の資料中濃度を品目ごとに比較することができる.リスト内に入った選択項目は,横についた X ボタンを押すことで非選択とすることができる.成分は 5 種類のカテゴリ(アミノ酸・ジペプチド,カロテノイド,ポリフェノール,リン脂質,一次代謝物)に分けてあり,リストの下のそれぞれのカテゴリの名前をクリックすると,該当する化合物を一括して選択することが可能である.

本データベースの有効性

NARO島津ラボにおいては,ターゲット分析で用いる標準試料の一部についてノンターゲット分析も同時に実施している場合があり,ノンターゲット分析の結果とターゲット分析の結果を比較することで,本データベースの有効性を確認できる.メチル化カテキンの 1 つであるエピガロカテキン-3-(3’’-O-メチル)ガレートを例として確認する.図 12は,本データベース上で,当該標準試料と茶 64 品種のノンターゲット分析(負イオン)の結果を同時に表示したものである.中心の星印が当該標準試料の結果を表し,黄,赤,緑の丸がそれぞれ表されたアラインメント(ID=356, 1375, 3418)を表す.図 12を見ると,星印のごく近傍に3つの黄色の丸が重なるように存在するのが分かる.これらは標準試料と極めて近い位置にプロットされているため,当該化合物である可能性が高いと期待できる.LC-QTOF を用いたノンターゲット分析においては,信号強度が弱いと検出精度が悪くなることが知られている.そのため,同一アラインメント内の上記 3 点以外の点については,信号強度が弱いために少し離れたところにプロットされたと考えられる.さらに,これらの結果をターゲット分析において確認する.図 13は,本データベースに格納された茶 64 品種の当該物質を対象としたターゲット分析の結果である.図のように,3 つのサンプルの含有量だけが突出して大きいことが分かる.実際に,ノンターゲット分析で当該物質の近傍にプロットされた 3 サンプルは,いずれもターゲット分析において突出した3サンプルと同じ「べにふうき」のものであった.これらにより,ノンターゲット分析の結果において,信号強度が強い場合には良い精度で分析結果が得られることが示された.

前述の通り NARO 島津ラボでは,ノンターゲット分析,ワイドターゲット分析,ターゲット分析と対象を絞り込みながら,より詳細な定量分析結果を得る手法を想定している.上記の結果は,この手法が有効であることを示唆している.

また,当該化合物を本データベースで検索すると,「目や鼻の不快感改善」という機能性情報が SR の情報と共に登録されていた.実際の分析現場において,分析対象を絞り込む段階で化合物の機能性を検索することができることも本データベースの特徴である.

本データベースの統合利用に向けた課題

本データベースは,複数の異なるデータソースのデータを統合して構築した.農研機構内で取得した機能性成分に関するデータを一か所に集約し,当初の目的は果たせた一方で,現状ではデータソース毎にデータを独立したテーブルに格納しており,それぞれに別の検索インターフェイスを備えている.また,化合物は名寄せを行ったことで統一的に扱えるようになったものの,農林水産物の品目・品種の統一的な扱いは実現できていない.これは,それぞれのデータの取得目的,提供目的が異なっていたことに起因する.機能性成分・評価情報データベースは,機能性成分を持つ食品を活用する際に参照するためのデータやエビデンスを中心にまとめたデータであり,管理栄養士など食の現場での利用が想定されるため,データは農林水産物の品目ごとにまとめられて,品目を軸に整理されている.一方で,NARO 島津ラボ等のデータにおいては,ターゲット分析・ワイドターゲット分析の結果は前者に近い利用も可能であるものの,基本的に農作物における化合物の含有量の測定結果をまとめたデータであり,育種現場での利用が想定されるため,SIP2 で得られた 32 食材のデータを除いてデータは品種ごとに取得され,品種を軸に整理されている.これらの統一的な扱い方については今後検討が必要である.このような問題は,取得目的や提供目的が異なるデータを統合して利用しようとする場合に避けて通れない問題であり,結局のところ利用者がどのようにデータを利用したいかという観点が重要であると考えられる.本データベースは,農研機構内の研究者および NARO 島津ラボの利用者による使用を主に想定しており,利用目的や使用感等のフィードバックを受けて適宜改良しながら今後の利用普及につなげたい.

おわりに

農研機構内で収集された機能性成分情報を集約するために,農研機構で 2015 年より公開している農林水産物の機能性成分・評価情報データベースのデータと,農研機構と島津製作所が共同で 2019 年度に立ち上げた NARO 島津ラボにおいて取得される機能性成分の分析データ,および SIP2 などのプロジェクトで得られた機能性成分の分析データをもとに,新たに「農研機構食品機能性統合データベース」を構築した.収録データには,オープンデータの他,一部クローズドデータも含まれるため,認証・認可の機能を実装して利用者権限を管理できるようにした.データベースにはファセット検索を実装するとともに,フォームやグラフを用いたインタラクティブな可視化操作を実現し,特にノンターゲット分析においてはバブルを用いた新たな表示方法を採用するなど,先進的なデータベースを構築した.本データベースに格納された同一の標準試料に対するノンターゲット分析とターゲット分析の結果を比較することで,データの有効性が確認できた.本データベースがノンターゲット分析に始まりワイドターゲット分析,ターゲット分析へと徐々に対象を絞り込みながら有用な化合物を探しだすデータ駆動型育種研究の核となることを期待している.今後は,クローズドデータである NARO 島津ラボのデータの利用登録者の拡充を進めるとともに,NARO 島津ラボにおいて進められている農林水産物の各種分析データを随時追加する予定である.

謝辞

本研究の一部は,戦略的イノベーション創造プログラム(SIP)スマートバイオ産業・農業基盤技術」(管理法人:生研支援センター),および,COI-NEXT 研究成果展開事業 共創の場形成支援プログラム「つくば型デジタルバイオエコノミー社会形成の国際拠点」(国立研究開発法人科学技術振興機構)によって実施された.また,掲載データの一部は,「市場開拓に向けた取組を支える研究開発」プロジェクトのうち「地域の農林水産物・食品の機能性発掘のための研究開発」(農林水産省)により取得された.

利益相反

NARO 島津ラボは,島津製作所が資金を提供し,農研機構と島津製作所が共同で運用するものである.本研究は NARO 島津ラボで得られたデータを一部用いた.

引用文献
 
feedback
Top