主催: 公益社団法人 空気調和・衛生工学会
会議名: 令和3年度空気調和・衛生工学会大会(福島)
開催地: 福島
開催日: 2021/09/15 - 2021/09/17
本論文では、複数の外気量を有する土壌熱交換システムの強化学習の第一段階として、Multi Discrete Action環境への強化学習制御の適用性を検討した。Agentが選択した行動と反事実の行動を評価する報酬関数を定義し、学習を行った。学習の結果、外調機の処理熱量の削減とシステム内の結露抑制に関する二種の報酬を同時に増加させる学習が可能であることを確認した。