論文ID: 23J15
環境適応性などの様々なニーズを満たす品種育成の加速化・効率化が必要であり,そのために大量の育種データ(育種ビッグデータ)に基づいた予測および選抜技術の開発が有効と考えられる.なお,これら育種ビッグデータを構築し利用するためには,国内の様々な育種組織が保有する作物育種データの一元化利用の仕組みが必要であるが,品種登録など知財確保が行われていない未公開の育種データも多く公開を前提とした一元化とその利用には困難な部分が多い.そこで,複数組織のデータを暗号化して集約し自組織データを他に明かすことなく処理や計算ができる「秘密計算技術」を適用することにより,安全かつ利便性の高い育種データの一元化利用が可能になる.例えば各都道府県の公設試や種苗会社などの複数組織が保持する機密性がある育種データを暗号化して他組織には内容を明かさずに収集し,暗号化したまま機械学習により表現型の予測モデルを作成して,そのモデルに基づく予測が可能となる.このような複数組織の育種データを用いた統合分析を行うことにより,育種の加速化・効率化に結びつくと考えられる.本論では,複数栽培地のイネの育種データの登録から機械学習モデルの作成およびそのモデルによる表現型予測までを秘密計算システム上で実行し,その適用可能性の評価を行った.具体的には予測精度と処理性能について平文との比較,および学習の全工程における秘匿性の評価を行った.その結果,単一組織のデータを用いた分析より,複数組織の育種データを互いに秘匿して活用可能な秘密計算の方が,予測精度が良いこと,またデータ登録から前処理,学習,評価,予測までの一連のAI処理全体を通してデータが秘匿できることを確認した.今後の課題は実利用場面での有用性の評価を行うことである.