Tetsu-to-Hagane
Online ISSN : 1883-2954
Print ISSN : 0021-1575
ISSN-L : 0021-1575
Mechanical Properties
Creep Life Predictions by Machine Learning Methods for Ferritic Heat Resistant Steels
Junya SakuraiMasahiko Demura Junya InoueMasayoshi Yamazaki
Author information
JOURNAL OPEN ACCESS FULL-TEXT HTML

2022 Volume 108 Issue 7 Pages 424-437

Details
Abstract

We have attempted to predict creep rupture time for a wide range of ferritic heat resistant steels with machine learning methods using the NIMS Creep Data Sheet (CDS). The dataset consisted of commercial steel data from 27 sheets in the CDS, covering various grades of carbon steels, low alloy steels, and high Cr steels. The prediction models were constructed using three methods, support vector regression (SVR), random forest, and gradient tree boosting with 5132 training data in order to predict log rupture time from chemical composition (19 elements), test temperature, and stress. Evaluation with 451 test data proved that all three models exhibited high predictivity of creep rupture time; in particular, the performance of the SVR model was the highest with a root mean squared error as low as 0.14 over the log rupture time, which value means that, on average, the prediction error was factor 1.38 (=100.14). The high predictivity achieved with no use of information on microstructure was presumably because the data used was for commercial steels in which there should be a correlation between the composition and the microstructure. We confirmed that the prediction did not work well exceptionally for two heats having the same composition but different microstructures with and without stress relief annealing. The predictivity could be drastically improved by adding the 0.2% proof stress at the creep test temperature as one of the explanatory variables. As a use case of the prediction model, the effect of elements was evaluated for modified 9Cr 1Mo steels.

1. 緒言

高温機器の設計や耐久性を評価する上で耐熱鋼のクリープ性能を予測することは重要である。材料開発のためには組成やプロセスによってクリープ性能がどう変化するかという見込みが得られることが望ましい。これまでにクリープ破断寿命やクリープ破断強度の予測に関して様々な試みがある。材料を特定した場合には,設計温度における等温クリープ破断データに基づいて,クリープ破断強度とクリープ破断時間の関係を多項式で近似する方法があり,これによって試験していない応力におけるクリープ性能を評価することが可能となる1)。ただし,フェライト系耐熱鋼では,クリープ破断強度-破断時間曲線に屈曲が観測され,短時間データからの外挿では大きな誤差を生じる懸念が指摘されている1)。さらに,試験していない温度でのクリープ性能を予測するために,種々の時間・温度パラメータ(TTP)が提案されている(文献1)や2)にまとまっている)。これを発展させる形で,殆どのTTPを包含する式を用いてパラメータ選択を客観的に行うMinimum commitment methodという手法3)や,変数選択型モデルによる重回帰分析などが提案されている1)。このように実験データが与えられている材料に関しては,破断時の応力-時間,さらには,応力-時間-温度の関係を多項式モデルで近似することによって,試験を行なっていない温度・応力条件でのクリープ性能を予測(あるいは補完)することは可能である。この他に組織変化にもとづいてひずみ速度の時間変化を求めここからクリープ破断寿命を予測するアプローチがある4)。しかしこれまでに広い鋼種を対象とした先行研究の事例は報告されていない。

これらの先行研究例はクリープ試験の結果があって初めて予測が可能となるため,任意の材料のクリープ性能予測を行う方法としては使用できない。これまでに狭い材料種の範囲に限定したものではあるが任意の材料に関してクリープ性能予測が行われた例が以下のように複数存在する。一つ目は,Bhadeshiaらが行なったニューラルネットワークおよび熱力学計算を用いた材料設計の例で,Fe-2.25Cr-1MoおよびFe-(9-12)Crに関して行われており5),提案材料に関する試験を行って予測との比較も報告されている6)。予測モデルに使用されたデータは主にFe-2.25Cr-1MoおよびFe-(9-12)Crからなり,市販鋼で規格に沿った材料のデータからなるNRIMクリープデータシートの5シートのほか27件の文献からも収集されている。ベイズニューラルネットワークを用いてクリープ破断応力を予測しており,特徴量には化学組成(19元素)とプロセス条件(焼準や焼戻しや焼鈍の温度と時間および冷却速度),クリープ条件(対数破断時間と試験温度)からなる37変数が用いられている。データ数は2066,半分で訓練が行われ,半分で予測モデルの性能評価が行われた。Fe-(9-12)%Crにおいては,予測に基づいて高いクリープ破断応力を有すると予測された材料を提案し,実験で検証されている。一部に予測が再現されている部分があったものの,ほとんどの条件で予測を下回ったと結論されている。二つ目は,機械学習によって高Cr鋼(9-12%Cr FMA)およびオーステナイト系ステンレス鋼(347H)の予測を行った例である7,8)。機械学習手法としてはGaussian Process regression, Neural Network, Gradient Boosted Decision Treeが使用されている。使用データは,NIMSクリープデータシート9編とNIMS疲労データシート4編が文献に挙げられており,National Energy Technology Laboratoryで収集され編集されたデータと記載がある8)。全部で1203データが使用されている。特徴量として化学組成(23元素),熱処理,オーステナイト粒度,試験温度,破断伸び,破断絞りからなる30変数を用いてクリープ破断強度を予測するモデルが作成されている7)。破断寿命は特徴量として使用されていない。高い予測性が報告されているものの,実際にクリープ試験を行わなければ得られない破断伸びや破断絞りの情報が説明変数として使われている点で,未知の材料のクリープ性能予測には適用できない。3つ目は,Cr-Mo鋼についてクリープ寿命予測モデルを作成している例9)であり,Random Forestなど9種の機械学習の回帰手法が検討されている。NIMSクリープデータシートから2.25Cr鋼,9Cr鋼,12Cr鋼の2066サンプルが用いられ,化学組成,熱処理情報と試験条件からなる21入力変数を使用している。10-fold交差検証による予測精度評価が対数寿命や3種のTTPを目的変数として実施され,中でもRandom Forestモデルが高い精度を示し最適と結論されている。

また,以下の例は寿命予測の予測モデルの構築を行うものではないが,寿命に関する影響因子を解析する試みがある。1つは9--12Cr鋼の範囲で材料設計のために行われた解析の例10)であり,各温度のデータをまとめたLMPの線形回帰のほか,各温度毎に破断時間の線形回帰モデルの最良な説明変数サブセットを探しLasso回帰で不要な変数を刈り込むことで各変数の元素の影響に関して検討がなされている。2つめは,材料種にわたる範囲より狭いがGr.91鋼の中でヒート間強度差を分析した事例11)があり,領域区分法でクリープのメカニズムごとに分けた各領域においてフィッティングを行い元素含有量や硬さや旧γ粒径のLMPへの影響を分析している。

このように,これまでにクリープ性能を予測するためのさまざまな先行研究が報告されているが,未知の材料に適用できる予測は,筆者の知るところFe-2.25Cr-1MoおよびFe-(9-12)Crを対象としたBhadeshiaらの研究5,6)のみであり,フェライト系耐熱鋼全体を対象とした広い鋼種への適用事例はこれまでにない。NIMSのクリープデータシート12)には,市販鋼かつ規格が設けられている多くの鋼種に関する高品質なデータが豊富に蓄積されてきており,フェライト系耐熱鋼に限っても炭素鋼から高合金鋼までの様々な試験温度・応力におけるクリープ破断寿命のデータが報告されている。統計手法や機械学習手法の発達した現在では高性能な予測手法が利用可能であり,これらを用いることによって規格鋼の鋼種に対して広範囲の予測ができる可能性があると考える。

本論文ではフェライト系耐熱鋼の規格鋼を対象に広範囲の鋼種でクリープ破断時間の予測モデルの作成を試みる。クリープ破断試験を行わなければ得られない情報は説明変数に用いずに,化学組成,試験温度,試験応力からクリープ破断時間を予測する。

2. データおよび手法

2・1 データ

NIMSクリープデータシート12)よりフェライト系耐熱鋼の27データシートを使用した。使用したシートのシート番号,材料の分類および対応する規格をTable 1に示す。炭素鋼から低合金鋼,高合金鋼に至る全212種類の幅広いフェライト耐熱鋼のクリープデータが含まれている。耐熱性を上げるために添加されるCrに関しては,無添加のものから12 wt%までとなっている。

Table 1. List of NIMS Creep Data Sheet used in this study.
CDS Category Material Standard Structure
7B Carbon Steels 0.2C STB 410 Ferrite/Pearlite
17B Carbon Steels 0.3C SB 480 Ferrite/Pearlite
40A Carbon Steels 0.2C-1.3Mn STB 510 Ferrite/Pearlite
25B Carbon Steels High Strength Steel (Class 590 MPa) SPV 490; SM 570 Ferrite/Pearlite/Bainite
8B Low Alloy Steels 0.5Mo STBA 12 Ferrite/Pearlite
18B Low Alloy Steels 1.3Mn-0.5Mo-0.5Ni SBV 2 Ferrite/Pearlite/Bainite
20B Low Alloy Steels 0.5Cr-0.5Mo STBA 20 Ferrite/Pearlite
1B Low Alloy Steels 1Cr-0.5Mo STBA 22 Ferrite/Pearlite
35B Low Alloy Steels 1Cr-0.5Mo SCMV 2 NT Ferrite/Pearlite
9B Low Alloy Steels 1Cr-1Mo-0.25V A470-8 Ferrite/Pearlite/Bainite
31B Low Alloy Steels 1Cr-1Mo-0.25V A356/A356M-9 Ferrite/Pearlite/Bainite
2B Low Alloy Steels 1.25Cr-0.5Mo-Si STBA 23 Ferrite/Pearlite/Bainite
21B Low Alloy Steels 1.25Cr-0.5Mo-Si SCMV 3 NT Ferrite/Pearlite/Bainite
3B Low Alloy Steels 2.25Cr-1Mo STBA 24 Ferrite/Pearlite
11B Low Alloy Steels 2.25Cr-1Mo SCMV 4 NT Ferrite/Pearlite/Bainite
36B Low Alloy Steels 2.25Cr-1Mo A542/A542M Martensite/Bainite
53 Low Alloy Steels 2.25Cr-1Mo-0.3V SFVCM F22V
54A Low Alloy Steels 2.25Cr-1.6W KA-STBA 24J1;
KA-STPA 24J1
Ferrite/Pearlite/Bainite
12B Low Alloy Steels 5Cr-0.5Mo STBA 25 Ferrite/Pearlite/Bainite
19B High Cr Steels 9Cr-1Mo STBA 26 Martensite/Bainite
43A High Cr Steels 9Cr-1Mo-V-Nb SA-213/SA-213M Grade T91; SA-387/SA-387M Grade 91; SA-335/SA-335M Grade P91 Martensite/Bainite
46A High Cr Steels 9Cr-2Mo KA-STBA 27 Martensite/Bainite
48B High Cr Steels 9Cr-0.5Mo-1.8W-V-Nb SA-213/SA-213M Grade T92; SA-335/SA-335M Grade P92 Martensite/Bainite
51A High Cr Steels 11Cr-2W-0.4Mo-1Cu-Nb-V KA-SUS 410J3 TP; KA-SUS410J3; KA-SUS410J3TB Martensite/Bainite
13B High Cr Steels 12Cr SUS 403-B Martensite/Bainite
10B High Cr Steels 12Cr-1Mo-1W-0.3V SUH 616-B Martensite/Bainite
52A High Cr Steels 12Cr-2W-0.4Mo-1Cu-Nb-V KA-SUS 410J3 DTB Martensite/Bainite

専門知見に基づいて,初期の微細組織をferrite/pearlite, ferrite/pearlite/bainite, martensite/bainiteの大きく3種類に分類した(Table 1のStructure列)。各々の微細組織ごとにデータセットのシート数,ヒート数,試験条件数をTable 2にまとめた。データ数は全体で5657ポイントあり,各微細組織に分類されるデータ数はそれぞれ1800前後とほぼ3等分されており,データ数に大きな偏りは見られない。

Table 2. The number of data points used in this study.
Category Sheets Heats Conditions
Ferrite/Pearlite 8 71 1734
Ferrite/Pearlite/Bainite 9 85 2047
Martensite/Bainite 9 56 1802
others (CDS53) 1 2 74
Total 27 212 5657

データシートからヒート毎に組成,クリープ試験応力,クリープ試験温度,各クリープ試験温度における0.2%耐力,クリープ破断時間を抽出して使用した。データの使用にあたり次のような前処理を施した。

•組成[mass%]はシート毎に測定された元素のセットが異なる。組成値が与えられていない場合には0と仮定した。Fe[mass%]に関しては100-(他組成値の合計)により値を与えた。

•クリープ試験温度における0.2%耐力は殆どの条件で存在していたが,欠損の場合には付録A1に述べるスプライン補間により内挿した値を用いた。

•試験温度の単位をKに統一

特徴量には化学組成,クリープ試験条件を用いた。化学組成は,C, Si, P, S, N, B, Mn, Ni, Cr, Mo, Cu, Al, Ti, Nb+Ta, V, W, Co, Fe, Nb, Snのmass%を用いている(なお,CDS40Aの2ヒートのみにNb+Taの値が存在するがこれはそのまま取り扱った)。試験条件は温度と応力である。これらに加えて,組成が同一でプロセスの異なるケースを予測する場合に,プロセスの影響を反映できる特徴量として,試験温度における0.2%耐力を用いた。目的変数はクリープ破断時間[h](tr)の常用対数log10trとした。なお,微細組織ラベルは回帰には使われず組織別モデルの作成におけるデータ分割のみに用いた。説明変数と目的変数をTable 3にまとめた。

Table 3. Explanatory and objective variables used in this study.
Category Variable
Explanatory variable {C, Si, P, S, N, B, Mn, Ni, Cr, Mo, Cu, Al, Ti, Nb+Ta, V, W, Co, Fe, Nb, Sn} [mass%]
Test temperature[K]
Test stress[MPa]
0.2% proof stress[MPa]
Objective variable log10tr

2・2 手法

2・2・1 回帰アルゴリズム

Support Vector Regression(SVR),Random Forest(RF),Gradient Tree Boosting(GTB)の3種のアルゴリズムを用いた。これらはいずれも機械学習による回帰手法の中で比較的よく使用されるものであり,性能も高い。

SVRは優れた分類モデルとして知られるサポートベクターマシンの数理的枠組みを活用した回帰モデルである。回帰変数(特徴量)を適当な関数で変換することで線形回帰問題へ帰着させることを基本的な構図とする。カーネルトリックと呼ばれる数学的テクニックを用いて,特徴量を変換する関数そのものを知らないまま回帰を行うことができる。回帰を行う際に最小化するコスト関数に,係数の正則化項が含まれるため過学習に強い。さらに,サポートベクトルと呼ばれる訓練データの一部のみが含まれる形で回帰モデルが構成されるため,回帰モデルが軽量になる点が優れている。SVRの数理的な背景は,参考文献に詳しい13)。今回はRのkernlab14)ライブラリのksvmで利用可能なnu-svrを用い,RBF(Gaussian Radial Basis Function kernel)カーネルを採用した。学習の中で決定されないいわゆる超パラメータとしてはnu, epsilon, C, sigmaがあり,nu, epsilonはデフォルト値を使用し,Cとsigmaに関しては次節に述べる調整を行った。

RFはアンサンブル手法の一つであり,ランダムに生成された多数の回帰木による予測値を平均することで過学習を防ぎつつバイアスを減らして予測精度を高める手法である15)。回帰木が多数集まった「林(forest)」によって予測するところから命名されている。回帰木は特徴量についての不等式によって枝が分岐され,最終的に葉と呼ばれる終端に予測値が与えられている。訓練データからランダムサンプリングしたデータをもとに,ランダムに選択された特徴量を用いて回帰木が生成される。一つ一つの回帰木はそれほど深い階層を持たさず,学習器としては弱い。しかし,弱学習器を数百から数千用いるアンサンブルが効果を発揮し,優れた回帰性能が期待できる。今回は,Rのranger16)ライブラリを使用し,splitrule(分割ルール)はvarianceを用いた。予測に影響を与える超パラメータにはmtry(各ノードでの分割に使用されうる変数の数),min.node.size(最小ノードサイズ),max.depth(回帰木の最大深さ)等があるが,mtryとmin.node.sizeを調整し,他はデフォルト値を使用した。

GTBは回帰木を弱学習器として多数使用するアンサンブル手法である点はRFと同じであるが,回帰木の生成を予測精度を高めるように逐次行う点が異なる。このように予測精度を高めるように回帰木を生成する手法をブースティングと呼び,回帰木の分岐のパラメータを決定する際に,コスト関数の勾配を利用することで学習を効率化するものがGTBである。その中で,今回は,コスト関数に葉の係数による正則化項を含むことで過学習を防ぎつつ,数理モデルの工夫で学習過程を高速化しているXGBoost17)を用いた。予測に影響を与える超パラメータには,max_depth(回帰木の最大深さ),eta(学習率),subsample(各木で抽出されるサンプルの割合)等があるが,超パラメータとしてeta, max_depth, min_child_weight, subsample, gamma, colsample_bytreeを調整し,他はデフォルト値を使用した。

2・2・2 テストデータ・訓練データの抽出

以降で述べる超パラメータ最適化中で行われる交差検証法および予測性能評価中で行われるホールドアウト法において,テストデータと訓練データへの分割をどう行うかが結果に影響を及ぼしうる。単純な無作為抽出を行った場合には特定のヒートの訓練データに偏りその挙動に引きずられた評価となる可能性や,組成に関する領域毎に訓練データの疎密が生じて偏った評価を行う可能性が懸念される。この問題を回避するために,本研究ではそれぞれのテストデータの抽出方法としてヒートに関する層化サンプリングを採用した。即ちヒート毎に同じ割合でテスト・訓練データへの分割を行うことによってテストデータを各ヒートから満遍なく選ぶようにした。

2・2・3 超パラメータ最適化

予測モデルの作成段階では決定できないパラメタは超パラメータと呼ばれる。最終的な予測モデルの性能が最も高くなるように,次のような手続きで超パラメータを最適化した。

SVR,RFの超パラメータに関してはグリッドサーチと交差検証18)による最適化を行った。超パラメータの直積からなる探索空間内で格子状に設けた条件の組それぞれについて交差検証による予測性能の評価を与え,最も性能のよい超パラメータの組を選択した。交差検証は未知条件に対する予測性能を評価する手法である。ここでは,10-fold RMSE(Root Mean Squared Error)を用いた。交差検証に用いるデータは,ヒートに関して層化サンプリングを行い,いずれのヒートのデータも均等に分割されるようにした。

GTBに関しては,学習に時間がかかることからグリッドサーチは難しく,逐次的に最適化を行うことにした。ここでは,Sequential Model-based Global Optimization(SMBO)を用い,逐次的に期待損失を減少させることで最適化を行った19)。そこで用いられる損失の予測や期待値のための計算アルゴリズムとしてHyperoptライブラリ19)のTree-structured Parzen Estimator Approach(TPE)を使用した。目的関数には10-fold RMSEを用いた。交差検証のデータセットは,SVR,RFの場合と同様に,ヒートに関する層化サンプリングによって分割した。探索回数1000回として超パラメタを最適化した。

2・2・4 予測性能評価

予測性能の評価にはホールドアウト検証18)を用いた。ヒートに関して層化サンプリングを行い訓練データ:テストデータ=9:1の割合で分割を行った。まず訓練セットを前述の超パラメータ最適化に用いて超パラメータの組を決定する。この最適化された超パラメータの組と訓練セットを用いてモデルを作成した。このモデルを用いたテストセットの条件について予測を行い,予測値と観測値から求めたRMSEによってモデルの予測性能評価を行った。

3. 結果・考察

3・1 予測モデルの作成と考察

3・1・1 予測可能性の検討

上記3回帰手法に関して超パラメタ最適化および予測性能評価を行った。ここで使用するデータはTable 1からCDS53を除いたものであり,存在する5583条件を訓練データ5132点とテストデータ451点に分けて使用した。CDS53を用いた場合については後述する。使用する説明変数は化学組成とクリープ試験条件を用い,0.2% proof stressは用いていない。組成変数のうちSnに関してはここで用いるデータにおいて全て0であるため予め除外した(後の節でCDS53を用いた際にのみSnの値が存在するため使用した)。最適化された超パラメタは付録A2に記載した。

テストセットに対する予測値と観測値をFig.1(a)–(c)にプロットした。プロット中で実測値と予測値を破断時間に換算した値の比が1/2および2,すなわち予測誤差がfactor 2の位置を緑線で示した。点は密集し重なっているため緑線外の値が目立つが,テストセットの451条件のうち緑線より予測値が外れる点数はそれぞれSVRで22点,RFで88点,GTBで60点とわずかであり,特にSVRでは少ない。RMSEの値をTable 4に示した。いずれの手法でも多くの条件で良い予測を与えているが,RMSEによる評価では3手法のうちSVRが最も良い予測性能を示した。SVRのRMSEは0.14である。これは平均的な予測誤差がfactor 1.38(=100.14)であることを意味しており,高精度な予測が可能であることを示している。

Fig. 1.

Comparisons between observations and predictions for test data (451 data points) for each method: (a) SVR; (b) RF; (c) GTB. (Online version in color.)

Table 4. RMSE for the test data (451 data) for each method.
method RMSE
Support vector regression 0.14
Random forest 0.28
Gradient tree boosting 0.22

鋼のクリープ寿命は微細組織に依存する。今回作成したモデルは組成および試験条件のみを説明変数に用いており,微細組織を直接的あるいは間接的に表現する特徴量を使用していない。それにも拘わらず高精度な予測性能が得られた理由は次のように考えられる。まず,CDSに含まれるデータはいずれも市販鋼のものであり,素材の品質を保証するためにプロセスは十分に最適化されていると考えられる。つまり,化学組成が決まるとプロセスが決まるという関係にあり,実質的に化学組成にプロセスの情報が含まれていたと考えられる。これは論文データを用いた場合では成立しない。論文データには,同一組成でプロセスの影響を調べた研究からのデータや,プロセスが必ずしも最適化されていないデータが混在するため,今回のように化学組成だけを用いた予測はできないと考えられる。実際に,このケースに該当するCDS53については後述するように化学組成だけでは予測ができず,予測を行うためには微細組織の情報を取り込む必要がある。加えて,化学組成の分布がグループ化されているという特徴も関係していると考えられる。CDSの試料は規格ごとにグループ化されており,化学組成は規格が異なるシート間で大きく異なり,規格が同じシート内でのヒート間では比較的小さく,同じグループに属するシート内の各ヒートは微細組織の特徴が基本的には同じであると想定される。このように化学組成によって属する規格が決まり,微細組織の特徴が決まるという関係にあったものと考えられる。すなわち,今回得られた高精度な予測モデルは微細組織情報を要求しない代わりに,フェライト系耐熱鋼の規格の範囲でのみ適用できるものと考えられる。

既に述べたように平均的には予測精度は高いものの,factor 2以上の予測誤差が生じたケースが少数ながら存在した。具体的には,SVRで22点,RFで86点,GTBで60点が,factor 2以上の誤差が生じていた。共通して予測が悪かったのはTable 5に示す8条件であった。このうちCaG, CaM, MFG, MhX, LAFでは試験応力が0.2%耐力より大きな条件である。降伏点を超えたクリープ試験は破断時間が一般的に短く,荷重の掛け方など試験初期の条件に結果が左右されやすく寿命がばらつく傾向にある。このような降伏点を超えた試験応力におけるクリープ破断時間の予測は難しいものと考えられる。特にMFGのケースでは同一試験条件で大きく破断時間が異なる2つの観測値(1.2 h,77.8 h)が存在し,そのうち一方(77.8 h)が訓練データ,他方がテストデータであった。同一条件で異なる値が存在する場合には予測モデルの構築は難しい。そのほか,CaG, CaM, MhXは試験片を厚板材から採取する際の採取位置によるばらつき,MgAは740°C-8.4 hの応力除去焼きなましの板材中の不均一などが予測を困難にしていた要因である可能性が考えられる。

Table 5. The conditions that the absolute value of the difference between the predicted and observed value is greater than log10(2) for all methods.
CDS Heat Temp.
[K]
Stress
[MPa]
0.2% proof stress
[MPa]
log10tr
(exp.)
log10tr
(SVR)
17B CaG 723.15 373 227 1.52 2.03
17B CaM 673.15 353 194 4.08 3.77
20B MFG 823.15 294 178 0.08 0.85
21B MhX 823.15 294 275 0.71 1.10
43A MgA 773.15 300 374 2.80 3.34
43A MGC 773.15 270 421 4.80 4.49
54A MLA 848.15 160 354 4.57 3.95
8B LAF 723.15 373 192 3.89 2.89

3・1・2 データ量依存性

一般に訓練データ数を増すことで予測精度は向上する。データ量の豊富さが予測精度の高さにどれほど寄与していたかを,次のように検討した。まず,5583条件のうちからヒートに関する層化サンプリングで1割のテストデータ(451点)を取り分けておく。残りのデータ(5132点)をヒートに関して層化サンプリングし1,2,3,4,5,6,7,8,9,10割のデータ数をもつ訓練セットをそれぞれ生成した。ヒートによる層化サンプリングを用いることで,データが少数の場合でも,データが与えられていないヒートを予測する不利が生じないため,純粋にデータ数の影響を評価できる。それぞれの訓練セットに関して5-fold RMSEを評価に用いてグリッドサーチによる超パラメータの最適化を行い,得られた超パラメータを用いて予測モデルを作成した。Table 6に示したように,超パラメータは訓練データセットによって異なっている。作成した予測モデルの性能を,予め取り出しておいたテストデータを用いてRMSEによって評価した。

Table 6. Number of training data, hyperparameters tuned, and predictivity for each condition.
Number of training data hyperparameter tuning prediction error
C sigma 5-fold RMSE RMSE (test)
5132 300 0.15 0.183 0.141
4621 350 0.15 0.193 0.150
4111 250 0.15 0.216 0.159
3588 350 0.10 0.215 0.166
3080 450 0.08 0.230 0.169
2573 350 0.08 0.250 0.188
2056 350 0.10 0.284 0.209
1542 350 0.04 0.301 0.242
1028 250 0.04 0.361 0.265
530 150 0.04 0.509 0.391

Fig.2に訓練データ数とRMSEの関係を両対数プロットで示す。Table 6にはRMSEの値も列記した。訓練データ数を減らすとRMSEは明瞭に増加し予測精度が悪化する。訓練データ数が最大の点におけるRMSEに対してデータ数3000ではRMSEが0.03程度大きく,データ数1000程度ではRMSEが0.12程度大きい。factor 1.4程度という今回の高い予測性能の実現はデータの豊富さによってもたらされていることがわかる。予測精度はデータを追加しても際限なく向上出来るものではなく,データ数が増えても予測精度がそれほど増加しない,いわゆるデータ数増加の効果が飽和する段階もよく見られる。Fig.2の対数訓練データ数と対数RMSEの間には直線関係が認められ,この関係は訓練データ最大の点付近でも維持されている。このことはデータの追加によって更に予測精度を向上できる余地があることを示唆している。

Fig. 2.

Effect of data size on the predictivity for the SVR model.

3・1・3 熱処理の異なるデータへの対処

前述の予測モデルでは組成と試験条件を用いて精度良い予測を行えていたが,CDS53に含まれる2ヒートVdA, VdBに対しては,予測がうまくいかない。CDS53を含めて上述と同様にSVRによって予測モデルを作成したところ,Fig.3(a)に示すように,VdA, VdBに関しては予測精度が極めて悪い。この鋼種は圧力容器に用いられるものであり,溶接後に応力除去のための焼きなましが想定されている。Table 7に熱処理の違いを示すように,VdAは素材メーカーによって施された焼入れ焼戻しのみであり,VdBではこれに応力除去焼きなましが追加で施されている。VdBは応力除去焼きなましによって軟化し,多くの試験条件で破断寿命が一桁以上短い。このため,VdAに対しては短め(安全側)の予測となり,VdBに対しては長め(危険側)の予測となっている。3・1・1では微細組織情報を与えずとも予測できた理由をデータセットに組成-微細組織間の対応関係があるためだと考察したが,この2ヒートでは同一組成でありながら熱処理によって微細組織が異なったために,組成だけでは微細組織依存のクリープ性能差を表現出来なかったためと理解できる。

Fig. 3.

Observations and predictions of log creep rupture time for the two heats, VdA and VdB in CDS 53. Their compositions are the same but heat treatments are different. (a): Explanatory variables are composition and test conditions; (b): 0.2% proof stress is additionally used together with composition and test conditions. (Online version in color.)

Table 7. Heat treatments for the two heats included in CDS53.
heat processing and thermal history
VdA Forged
1020°C/7h WQ
695°C/11h AC
VdB Forged
1020°C/7h WQ
695°C/11h AC
625°C/10h AC
705°C /30h AC

この2ヒートの性能差を表現するという課題は,微細組織の影響を繰り込んだ予測方法を構築することに他ならない。熱処理に代表されるプロセス情報を使用することが考えられるが,炭素鋼から高合金鋼までを広くカバーしようとすると,鋼種によって熱処理の考え方は異なり,統一した特徴量を設定することは難しい。同じ鋼種であっても,Table 7にあるように,応力除去焼きなましによって熱処理が多段階に追加されていき,統一的な記述はできない。加えて,素材メーカからは,すべてのプロセス条件が与えられているわけではない点も留意する必要がある。このように,本研究のような広い組成範囲で成立する予測モデルを作る場合にはプロセス情報を使用することは難しい。プロセスではなく微細組織を反映すると考えられる特徴量を使用することを考える。微細組織そのもののデータはなく,微細組織に影響を受ける因子を検討する。CDSの中でヒートに共通して含まれる特徴量の中で微細組織に影響を受けるものとして室温硬さと高温引張特性を挙げることができる。高温の性能を予測する上では高温の特性を利用することが本質的に重要と考えられるため,ここでは高温引張特性を利用することとした。具体的には,クリープ試験温度における0.2%耐力を特徴量に加えてSVRによる予測モデルを作成した。結果をFig.3(b)に示す。0.2%耐力を加えることで,予測精度は劇的に改善し,同じ組成でありながら熱処理の違いから全く異なる寿命を有するVdAとVdBについて,その違いを予測できることがわかる。このように0.2%耐力を用いることで,微細組織の情報を繰り込んだ予測が可能となることを見出した。高温引張試験は取得するために実験が必要ではあるため未知の材料に対する予測モデルとしては使用できないものの,高温引張特性はクリープ特性と比較すると遥かに低コストかつ短時間でデータを取得できるため,十分にメリットはあると考える。

3・1・4 組織別の予測モデル作成

データセットには様々な微細組織のものが含まれており,予め組織の類似した材料に分けてそれぞれの予測モデルを作成することで予測性能を高められるのではないかと考えた。すでに述べたように,微細組織そのもののデータはないため,化学組成,熱処理,光学組織写真から専門家が推定した初期組織の分類情報を活用することの是非を検討した。具体的には,Table 1にまとめたように,Ferrite/Pearlite,Ferrite/Pearlite/Bainite,Martensite/Bainiteの3種類に分類し,それぞれのグループで予測モデルを作成することで,予測性能が上がるかどうかを検討した。

予測性能の比較手順をFig.4に示した。All dataはCDS53を除く全シートのデータを含んでおり,これを微細組織ラベル毎に分け,Ferrite/Pearlite data,Ferrite/Pearlite/Bainite data,Martensite/Bainite dataに分類した。各データセットのデータ数はそれぞれAll dataで5583点,Ferrite/Pearlite dataは1734点,Ferrite/Pearlite/Bainite dataは2047点,Martensite/Bainite dataは1802点である。各データセットを用いて最も予測性能が高かったSVRにて予測モデルを作成した。All dataを用いたものをUnsplit model,その他は各微細組織ラベル名に因んだモデル名で呼ぶ。予測モデルを作成する際には交差検証によって超パラメータを調整しており,その際の手順は3・1・1で述べたものと同様である。予測性能の評価はホールドアウト法で行なった。Unsplit modelについてはテストデータとその予測値を微細組織ラベルで分類し,それぞれのデータを用いて評価したRMSE値を対応する微細組織ラベルのモデルのRMSE値と比較した。さらに各分割データで訓練されたモデルによる予測結果を結合して総合モデル(Ferrite/Pearlite model & Ferrite/Pearlite/Bainite model & Martensite/Bainite model)として扱う。その上で,Unsplit modelと総合モデルの間でAll dataにおける予測性能の比較を行った。

Fig. 4.

Flow diagram to evaluate the effect of splitting data group based on the initial microstructures of Ferrite/Pearlite, Ferrite/Pearlite/Bainite, and Martensite/Bainite. (Online version in color.)

Table 8に結果を示した。モデルの種類を行に,テストデータの種類を列に示し,モデルとテストデータの各組についてホールドアウト検証によるRMSEを示した。unsplit modelと,微細組織で分類したモデルは,予測性能にほとんど差がない。Ferrite/Pearlite/Bainite modelおよびMartensite/Bainite modelはunsplit modelとRMSE値は同じであり,Ferrite/Pearlite modelはunsplit modelよりも僅かに予測性能は低下した。微細組織情報を活用したことになる統合モデル全体で見ると,unsplit modelよりも僅かに予測性能が低い。ただしサンプリングにより生じうるばらつきの程度は未評価であり,この程度の差が有意な差であるかは疑問である。この結果から,微細組織ラベルを活用することで予測性能を向上させることはできなかったと結論できる。換言すると,この程度の微細組織のラベル分けに相当する情報は化学組成のみから取得できているということになる。これは組成と微細組織の間に対応関係があるという前述の考察と整合する。

Table 8. RMSE evaluated on the corresponding test data for the unsplit data model, the models for each initial microstructure, and the combined model.
All data Ferrite/Pearlitedata Ferrite/Pearlite/Bainitedata Martensite/Bainitedata
Unsplit data model 0.14 0.17 0.13 0.13
Ferrite/Pearlite model &Ferrite/Pearlite/Bainite model &Martensite/Bainite model 0.15
Ferrite/Pearlite model 0.18
Ferrite/Pearlite/Bainite model 0.13
Martensite/Bainite model 0.13

一方で,各データセットの予測精度を比較すると興味深いことに気がつく。Ferrite/Pearlite/Bainite dataおよびMartensite/Bainite dataの予測精度に比べて,Ferrite/Pearlite dataの予測精度は明らかに劣っていた。Ferrite/Pearlite組織を有する鋼種ではクリープ寿命の予測がより難しいことを意味しているが,その理由は不明である。

今回得られた予測精度をWangらの先行研究9)と比較する。使用したデータはNIMSクリープデータシートの2.25Cr鋼,9Cr鋼,12Cr鋼から2066サンプルであると記述されているが具体的なシート等の情報は明示されていない。本研究で使用した9Cr鋼と12Cr鋼は合わせて1396点であるため,少なくとも670点以上は2.25Cr鋼のいずれかのシートに由来し,データ数から幾つかの2.25Cr鋼系のシートが含まれると考えられる。説明変数は組成(C, Si, Mn, P, S, Ni, Cr, Mo, W, Cu, V, Nb, N, Al, O)[wt%],熱処理情報(Normalizing Temperature[K],Normalizing Time[h],Tempering Temp.[K],Tempering Time[h]),試験条件(Testing Temp.[K],Constant Stress[MPa])であり,本研究では熱処理情報を使用していない点が異なるほか,鋼種範囲が異なるためか組成の元素の有無も異なる。O(酸素)の組成が説明変数に含まれているがデータシートには見つけられなかった。彼らの対数寿命予測モデルのうちRMSEが最も小さいのはSVRを用いたモデルであり,RMSE=0.2333である。また,総合的な結論で最適としていたRFについてはRMSE=0.2457であった。9Cr鋼と12Cr鋼のシートはいずれもMartensite/Bayeniteであるが2.25Cr鋼に関しては複数シートが3つの組織にまたがるため,今回作成したモデルとの比較を正しく行うことはできない。しかしながら,Martensite/Bayeniteの占める割合とデータ数の近さを考慮すると本研究のMartensite/Bayenite のデータが比較的近いと思われる。Martensite/Bayenite modelの予測誤差(RMSE=0.13)は先行研究のそれ(RMSE=0.2333)より小さい。さらに,Table 8に示した他の組織別モデルについても,その予測誤差は先行研究のモデルのそれよりも小さい。以上から,本研究で得られたモデルは,先行研究よりも予測精度が高いと予想される。

3・2 予測モデルのユースケース

3・1・1で使用した3手法のいずれも高い予測性能を示していた。ここでは高性能な予測モデルの用途を検討した。予測対象となるデータはTable 9に示すCDS43の改良9Cr-1Mo鋼(9Cr-1Mo-V-Nb)11ヒートであり試験条件を873 K-110 MPaに固定したものである。

Table 9. The composition and log10tr at 873K-110MPa for each heat in CDS43 (Gr.91).
Heat C Si P S N Mn Ni Cr Mo Cu Al Ti V Nb log10tr
MGA 0.1 0.38 0.015 0.001 0.05 0.4 0.12 8.53 0.96 0.022 0.014 0 0.21 0.076 4.39
MgA 0.08 0.34 0.005 0.004 0.059 0.49 0.09 8.34 0.89 0.02 0.012 0 0.23 0.07 3.92
MGB 0.09 0.34 0.015 0.001 0.042 0.45 0.2 8.51 0.9 0.026 0.016 0.001 0.205 0.076 4.42
MgB 0.08 0.34 0.005 0.004 0.059 0.49 0.09 8.34 0.89 0.02 0.012 0 0.23 0.07 4.03
MGC 0.09 0.29 0.009 0.002 0.044 0.35 0.28 8.7 0.9 0.032 0.001 0 0.22 0.072 4.33
MgC 0.1 0.24 0.005 0.001 0.0582 0.44 0.04 8.74 0.94 0.012 0.014 0 0.21 0.076 4.55
MGD 0.1 0.29 0.01 0.001 0.048 0.41 0.1 8.41 0.9 0 0.016 0.001 0.185 0.07 4.14
MgD 0.11 0.29 0.008 0.001 0.05 0.45 0.08 8.44 0.99 0 0.023 0.001 0.21 0.09 4.22
MGF 0.11 0.25 0.013 0.001 0.053 0.42 0.06 8.41 0.91 0 0.001 0.006 0.2 0.08 4.28
MGG 0.1 0.38 0.018 0.002 0.0458 0.37 0.12 8.6 0.95 0 0.002 0 0.19 0.08 4.27
MGQ 0.11 0.24 0.014 0.002 0.046 0.43 0.08 8.31 0.92 0 0.001 0.005 0.19 0.07 4.38

Table 9にあるように,実際の市販鋼を対象としたデータシートでは一元素のみが異なるヒートは存在せず,単純にクリープ破断時間を各元素の添加量に対して整理した場合には注目する元素以外の組成が背後で変化しており,注目する元素の影響のみを評価することが難しい。例えば筆者らの先行研究20)では,STB410の基底クリープ強度の領域におけるクリープ破断時間と各元素添加量の間のプロットを行ったところMo, Cr, Al, Mnについて正の相関が見い出されたが,これらはMoを使用した線形モデルで全て説明出来た。すなわちCr, Al, Mnについての相関は見掛け上のものであった。今回のように機械学習によってデータに内在する複雑な関係を写しとることにより,一元素組成のみを変化させた場合の傾向を仮想的に再現し,見掛けの影響を排除しつつ元素の影響を評価できると期待される。ここでは,GTB予測モデルを用いる。GTBのような回帰木を用いた予測では周囲にデータがない外挿的な領域では予測値が変動しなくなる。この特徴から,予測値が大きく変動する場合に着目することで,データに内在する構造を反映した傾向が取得できると考えられる。

対象シートでは14組成に値が存在するが,それ以外の組成変数を含めた18の元素について,影響を検討した。各ヒートの組成から指定した元素量だけを変化させた仮想的な化学組成条件について,3・1・1で作成したGTB予測モデルによる予測を得た。元素の変化の範囲は,当該元素について全データにおける下限から上限の範囲とした。Fig.5に,各元素を変化させた時の対数寿命予測値をプロットした。変化させた元素名は各プロットの上部に示す。各ヒートの化学組成から対象とした元素のみを変化させた予測値を各色の曲線で示している。実測値は点で示した(値はTable 9に記載)。各ヒートの組成条件の両端を縦の破線で示し,当該シートにおける元素量の存在範囲を表した。さらに,規格で指定されている範囲がある場合には,灰色の領域で示している。なお,CDS43には3種の規格(SA-213/SA-213M GradeT9121),SA-387/SA-387M Grade9122),SA-335/SA-335M GradeP9123))が含まれているが,ここでは各組成に関して設けられている制約の範囲のうち最も狭いものを示している。下限が無いものは0までの範囲で描いている。

Fig. 5.

Predictions of log rupture time at 873K 100MPa for compositional conditions in which the amount of each element is shifted from the original compositions of the heats in CDS43 (Gr.91). (Online version in color.)

GTBによる予測では階段状に予測値が変化している。すでに述べたように,周囲にデータが存在しない領域では木の分岐が生じないために予測値が一定となり,逆に周囲にデータが多い領域では細かな階段状の変化がみられる。

多くのヒートで添加されていないB, Co, Nb+Ta, Tiでは殆ど予測が変化せず,これらの効果については今回の手法では評価が難しいことが確認された。また,比較的データはあるAl, C, Cu, Mn, Ni, Pでも予測値の変化は僅かであったが,この結果からこれらの元素がクリープ寿命に影響を与えないとは直ちには言えない。

主要な添加元素であるCrに関しては,規格で規定されているグレーの範囲において,やや右肩上がりの傾向に見え,正の相関が認められる。

Moも主要な添加元素として知られている。CDSの全データ中には0.4, 0.5, 1, 2 mass%添加された高Cr鋼が存在しており,Moの影響が評価できる可能性がある。CDS43の近辺では予測値の大きな変化はみられず,特に規格の範囲内であれば,Moの僅かな違いはクリープ性能に影響を与えないといえる。さらに,規格の範囲を超えた領域においても,Moの影響は小さいように見える。先行研究によると,0.05C-9Cr-Mo-0.15V-0.05Nbの場合にMo量を1–2 wt%まで変化させても著しい破断強度の差は認められなかったという報告があり24),今回の予測はこの結果と矛盾しない。一方でCDS43の規格範囲からかなり離れた0.3Mo付近以下では予測値が小さくなる傾向がみられるが,Mo量が極端に少ない領域には高Cr鋼の訓練データは含まれておらず,この傾向の妥当性については実験的な検証が必要である。

Vについては,規格による制約範囲の下限付近より小さい濃度では予測値の低下が明確にみられ,規格がクリープ性能を担保するためにVの下限値を設定していることと極めてよく整合する。VについてはMX型炭窒化物による析出強化に寄与することが知られ,実際に意図的に添加している鋼種がGr.91鋼の他にも複数存在する。今回,データのみからVの添加の重要性が抽出できた点は興味深い。一方,V添加量を過剰に大きくすることの影響については,9Cr-1Mo-V-Nb-N鋼においてV添加量を0.15–0.32%へ増加するに従いクリープ破断強度が低下するという報告がある25)。しかし今回の予測ではこの領域におけるクリープ寿命の低下傾向を再現できていない。今回の訓練データにおいて0.24–0.3 mass%Vの範囲にあるデータは12Cr-1Mo-1W-0.3Vのものしかなく,かつその寿命は今回の試験条件(873K-110MPaにおける)においてCDS43の寿命に近い。このデータを反映して,高V領域でクリープ寿命が変化しないという予測になったものと考えられる。

Wに関しては1%程度以上の添加でクリープ寿命が大きくなっていく傾向が見られた。WはCDS43のヒートに添加されていないが,訓練データに含まれる他の高Cr鋼にはWを1,1.8,2%添加したものが存在し,これらのデータを反映した結果と考えられる。興味深いことに,実際に高Cr鋼のMoをWに置き換えることでクリープ強度を増した鋼種が開発されている26)

Siについては予測範囲全体にわたり緩やかに下降傾向がみられる。高Cr鋼における報告27)によると,Moが添加された9Cr-Mo鋼では,長時間高温にさらされることによってδ-フェライト/マルテンサイト境界やδ-フェライト粒内にLaves相が析出し,これが脆化を引き起こすとされている。この脆化メカニズムではフェライトにおけるMoの安定性が重要となるが,これに対してSiは間接的な役割を果たし,Si量が低減するとMoの平衡固溶量が増加してLaves相の析出が抑制されると報告されている。CDS43では1%程度Moが添加されており,Si量が低いとクリープ寿命が長くなるという傾向は先行研究と矛盾してはいない。Siの影響についてデータのみから抽出できた点は興味深い。

以上のように,化学組成とクリープ寿命との関係を学習することによって,V,W,Siなどの元素の影響について,実験研究の結果と矛盾しない傾向を抽出することができた。これは,今回使用したデータが種々の市販鋼に関するものであることと関係していると考える。市販鋼の化学組成は,添加する元素の選択や添加量の調整などにおいて,さまざまな先行研究の結果が反映されたものであり,化学組成とクリープ寿命との関係の中にフェライト系耐熱鋼の改良の歴史が現れている28)。今回のユースケースの検討結果は,機械学習によって,その背後にある専門家の知見を汲みとることができることを示唆している。本アプローチは,予測から得られる傾向の解釈,特に変化がない場合の解釈には注意を要するものの,データに隠れた構造を引き出せる方法論といえる。

4. 結言

NIMSクリープデータシートに蓄積された豊富なデータと高性能な機械学習手法を用いることでフェライト系耐熱鋼の広範囲でクリープ破断寿命の予測を行うことが可能か検討し,以下の結論を得た。

(1)訓練データ5132点を用いて組成・試験温度・試験応力を説明変数とした対数クリープ破断時間の予測モデルをSVR,RF,GTBの3手法で作成し,テストデータ451点で予測性能を評価した。3手法のいずれも高い予測性能を示し,多くの条件において寿命換算で1/2–2倍より良い予測ができた。予測精度が最も高かったSVRではテストデータに対するRMSEが0.14であり,これは平均的な予測誤差がfactor1.38であることを意味する。微細組織を表現する説明変数を使わずとも高い予測性能を示したのは,NIMSクリープデータシートが規格を満たす市販鋼を対象としているため,組成-微細組織間の相関がデータに内在したためだと推察される。今回の予測モデルは高予測性能で微細組織情報を要求しない代わりに,規格を満たすフェライト系耐熱鋼に限定されると考えられる。

(2)訓練データ数の予測精度への影響を調査した結果,訓練データ数の対数とRMSEとの間には直線関係があり,訓練データを減らすと予測精度が明確に悪化した。このことは今回の高い予測性能を得るためには使用したデータ数が必要であることを意味する。訓練データ数最大の点付近でも直線関係は維持されており,ここからデータの追加により更に予測精度を向上できる余地があることが示唆された。

(3)同一組成で応力除去焼きなましの有無が異なる2ヒートVdA,VdBに対しては予測性能が極端に悪かった。熱処理の違いによって微細組織が異なるためであると理解できる。微細組織の情報を反映させる意図でクリープ試験温度での0.2%耐力を説明変数に加えたところ,VdA,VdB共に高精度な予測を行うことが出来た。

(4)鋼種をFerrite/Pearlite, Ferrite/Pearlite/Bainite, Martensite/Bainiteに分類して,別々に予測モデルを作成してみたが,予測性能は向上せず全体を用いた予測モデルと同程度の予測精度であった。Ferrite/Pearliteに分類した鋼種はRMSEが0.17であり,他がRMSE0.13であったのと比較して,予測精度が悪い傾向が見られた。

(5)CDS43の改良9Cr-1Mo鋼(9Cr-1Mo-V-Nb)の11ヒートに関して,各ヒートの組成から指定した元素量だけを変化させた873 K-110 MPaの条件についてGTB予測モデルによる予測を行い,得られた予測値の傾向について検討した。Cr, Wについては予測値との間に正の相関が認められ,これらの元素が寿命向上に寄与していることが確認された。Vに関しては規格設定の妥当性がデータから確認できる結果となった。Moは規格の範囲内では予測値はほとんど変化しなかった。このほか,B, Co, Nb+Ta, Tiでは変化が見られず,Al, C, Cu, Mn, Ni, Pでは変化が僅かであった。これらの傾向は,組織観察等も含めて多面的な実験から導出された既存研究の結果と矛盾しない。このように,必ずしも単一元素のみを変化させたクリープ破断データでなくとも,データ量が十分であれば精度の高い予測モデルを作成でき,各元素の影響を抽出可能であることがわかった。

謝辞

本研究で紹介した一部の研究は,内閣府総合科学技術・イノベーション会議の戦略的イノベーション創造プログラム(SIP)「革新的構造材料」および「統合型材料開発システムによるマテリアル革命」(管理法人:JST)によって実施された。ここに記して感謝する。

文献
Appendices

付録A1 0.2%耐力[MPa]のクリープ試験温度[K]における内挿

静的試験データに関して各ヒート毎に温度と0.2%耐力に関するスプライン補間を実施し,クリープ試験温度を入力して0.2%耐力内挿値を得る。 スプライン補間にはR言語のstats::splinefun(x, y, method=“monoH.FC”)を用い,観測値を通る曲線を作成した。

付録A2 予測モデルの作成に使用したパラメータ

3・1・1において各予測モデルの作成に使用した関数のパラメータをTable A1にまとめて記載する。

Table A1. List of parameters used to construct each prediction model. Tuned parameters are denoted as T (True) and other parameters with default values are denoted as F (False).
Method Parameter Tuned Value Description
SVR (kernlab::ksvm) type F nu-svr specify a method for classification/regression
kernel F rbfdot the kernel function used in training predicting
nu F 0.2 nu sets the upper bound on the training error and the lower bound on the fraction of data point to become Suppport Vectors
C T 300 regularization term
sigma T 0.2 inverse kernel width for the radial basis kernel function
epsilon F 0.1 insensitive-loss function
RF (ranger::ranger) importance F impurity Variable importance mode. impurity: the variance for regression
splitrule F variance splitting rule
num.trees F 5000 number of trees
mtry T 20 Number of variables to possibly split at in each node
min.node.size T 1 minimal node size
GTB (xgboost.train) booster F gbtree king of booster (specified gbtree for GTB)
objective F reg:linear loss function
eval_metric F rmse Evaluation metrics for validation data
eta T 0.02 Step size shrinkage used in update to prevents overfitting (learning rate)
max.depth T 4 Maximum depth of a tree
min_child_weight T 1 Minimum sum of instance weight needed in a child
colsample_bytree T 1 subsample ratio of columns when constructing each tree
subsample T 0.6 Subsample ratio of the training instances
gamma T 0.5 Minimum loss reduction required to make a further partition on a leaf node of the tree
 
© 2022 The Iron and Steel Institute of Japan

This is an open access article under the terms of the Creative Commons Attribution license.
https://creativecommons.org/licenses/by/4.0/
feedback
Top