抄録
本研究では、H形鋼鋳造工程における実際の操業データを用い、機械学習による不良品発生の予測を試みた。協力企業であるヤマトスチール株式会社より提供された構造化データには、数値・順序・カテゴリ型を含む206次元の量質混合データと、不良有無のラベルが含まれている。本研究では、ランダムフォレストおよびLightGBMを用い、不均衡データへの対策としてアンダーサンプリング、SMOTE、クラス重み付けなどを比較した。実験の結果、数値・順序データのみを特徴量とし、LightGBMを用いてクラスの重みを調整した条件下で、F-Scoreが0.492と最良の予測精度を示した。今後は、時系列や画像といった他モダリティの情報を統合したマルチモーダル学習の導入により、更なる精度向上と不良発生メカニズムの解明を目指す。