抄録
人間とロボットとのインターフェイスが, 音声を用いた自由度の高い会話で実現されるならば, ロボットは人間にとってよ, り身近な存在となり, その利用の楊は大きく広がっていくことになろう.我々は, このような要求を満たすロボット用音声会話装置の開発を進め, 鍵盤楽器演奏ロボット・WABOT-2に組み込むことを試みた.本論文は, その概要について述べたものである.
システムは, 連続的に発声された文章を状況に応じて適切に解釈する会話音声理解部と, 自然な形で人間に対, し入力を要求し円滑に会話を進めていくための章声合成部から成る.
扱うタスクの変更に柔軟に対処するため, 理解部には音韻認識をベースにした方式が, また合成部にはCV素片編集型の規則合成方式が採用された.このような方式を採るとき, 理解部では特に調音結合と呼ばれる音韻環境に応じた音の変形が, 合成部では音質の劣化が問題となる.本研究では, 音韻認識に調音次元の特徴を利用することと, 合成部に肉ける素片結合時にフォルマント感度を考慮することを提案し, それぞれの問題を解決した.
また, 理解部における文解釈の部分には.バス重み付け可能なネットワークモデルを提案し, この重みをプロダクションルールで制御することを試みた.この方式によって会話の状況に応じて随時受理文ネットワークのある特定の部分に興味を集中させることが可能となり, 複数の意味にとれるあいまいな文章を一意に解釈する能力が実現された.
また, これちのアルゴリズみを合計15個のマイクロプロセッサから成るハードウェア上に実装することにより, 完全に実時間で動作させることに成功した.
以上の成果の下に, 従来の音声入出力装置では実現できなかった自由度の高い会話システムが構築できた.