音声から調音器官の運動状態を表す調音情報を推定する音声-調音逆マッピングは,音声の生成過程や音声知覚の解明の一助となるのみならず,様々な工学的応用に関しても重要である。本研究では,Residual Time-Delay Neural Networkを用いて磁気センサによる調音・音声パラレルコーパスから逆マッピングを構築する手法を検討すると共に,10名の話者それぞれに関して話者依存の逆マッピングを構築し評価を行った。推定誤差を先行研究と比較したところ,評価に用いたすべての話者において提案法は優れた精度で調音情報の推定が可能であった。
本研究では,日本語母語話者による日本語態度音声と,中国語を母語とする日本語学習者による日本語及び中国語態度音声を分析することで,態度のペアである「友好/敵対」,「丁寧/失礼」,「本気/冗談」,「賞賛/非難」の発話が態度及び発話者群によってどのように変化するのかについて検討した。態度音声にあらわれる音響特徴量(F0 mean, F0 range, Duration, H1-A1, H1-A3, F1F3syn)及び句末音調(平叙文と疑問文)の特徴を調べた結果,母語話者と中国人学習者では異なる態度表出パタンが見られた。更に,強調された単語について,Electroglottography信号によるOpen Quotientを抽出し分析したところ,中国人学習者が「冗談,賞賛及び失礼」の態度を日本語母語話者より緊張した発声で表出しており,中国語の態度表出方法に影響されている可能性を示した。