強化学習とルールベースを組み合わせた手法に Residual Reinforcement Leraning (RRL) があるが、RRL は一般に連続行動空間を対象としており、離散行動空間へはそのまま適用できない。本研究では、Deep Q Network をベースとして、離散行動空間を対象とした RRL を提案し、サーバーロードバランシングに適用した結果を紹介する。
本研究では, アナリストの個別銘柄に対するセンチメントが, 株式投資戦略に役立つかを実証する. これはアナリストレポートに自然言語処理を使用して極性指標を作成することで実現可能となる. 本研究では, 作成した極性指標に対し, 深層学習を用いて時系列予測を行い, 予測値についてレジームスイッチングモデルを用いてクラスタリングを行った. 加えて, 株式ポートフォリオを構築し, レジームの各変化点においてリバランスを行った. 結果, 本研究で提案した投資戦略がベンチマークのポートフォリオを上回るリターンを上げることができた. これにより, 極性指標が株式投資戦略の構築に役立つことが示唆された.
電気自動車(EV)の普及による充電ステーション(CS)の混雑を緩和するため,予約システムの導入が検討されている.しかし,導入による影響や効果的な運用方法などの知見が不足している現状がある.そこで,交通流シミュレータを用いて仮想空間内で実験を行う.本研究では,現実世界のEVドライバの充電予約行動を仮想空間内で表現する,充電予約行動モデルを作成した.このモデルでは,予約した場合と予約しなかった場合について,目的地までの予想所要時間を算出することで予約判断を行う.CSでの予想待ち時間をEVエージェントの経験によって更新することで,EVエージェントが充電環境に自律的に適応することを可能としている.
現在の在宅医療では,人の手によって患者と医師のマッチングや診療のスケジューリングが行われており,医師にとって非効率的なものとなってしまっている.そのため患者と医師の2者をマッチング・診療をスケジューリングするアルゴリズムの開発を行い,患者と医師にとって効率的で満足度の高いスケジューリングを自動的に作成できるようにする.具体的にはVRPという,複数の車両が全ての需要を満たし,総経路コストを最小化することを考える問題に,深層強化学習による解法を適用した.その後,時間制約や,症状や性別等による患者と医師のマッチングという在宅医療特有の条件を追加し、その問題に対して深層強化学習による解法を適用した.
現実世界で行動認識を行う際には,1人が行動を行っている状況だけでは無く,複数人が「読書」や「PC操作」などの別の行動を行っている場合が考えられる.そのため,1人のみを対象とした行動認識手法では不十分であり,複数人を対象とした行動認識手法が必要である.また,「読書」のような「人と物」との間に発生するインタラクションの認識をするためには,人物だけではなく,人物周辺の状況を考慮する必要だと考えられる.そこで本研究では,人物周辺の状況を考慮した行動認識手法の複数人への対応を試みる.
イベントの価値向上を持続的に支援するため、複数の出展者から成る大規模集客イベントで、オンラインでもリアルイベントにあるユーザ体験を提供する「Webツアー」と名付けたシステムによる実証実験を行った。その中で来場者・出展者間インタラクションに注目し両者が重要と考える項目をWebを通じ取得しデータ化、分析した。またデータからPLSAとベイジアンネットを用いて確率モデルを構築し、来場者にコンテンツをレコメンド、出展者に自コンテンツ来場者の特徴等の情報提示を行うシステムを開発し、提供価値の評価指標となる来場者回遊情報、両者双方の目的の達成度等を目的変数とした確率モデルを構築、活用方法の検討を行った。