抄録
強化学習を用い,障害物センサや操縦者の操作入力の情報に基づいて,オンライン学習により環境及び使用者の状態変化に応じた操縦支援の程度の調整を行うことが可能なシステムの構築を行った.提案するシステムは,車椅子に搭載したセンサにより障害物との距離を測定し,それに応じて使用者の操作量を修正する障害物回避補助装置と,操作量修正量を強化学習を用いて調整する障害物回避補助調整器から構成される.システムの有効性を、車椅子のモデルおよび操縦者モデルについてシミュレーションと実機を用いた走行実験により検証する.