音声から調音状態への逆問題における一対多の関係は古くから知られている。しかし,同一の範疇に含まれる音声に対する人間が調音可能なすべての状態を得ることは難しいため,その実体についてまだ十分に調査されていない。本論文は,音声と一対多の関係にある調音状態の全体像を明らかにすることを目的として,発話機構モデルを用いて日本語5母音を生成可能な調音状態を作成した。更に,作成した日本語5母音の調音状態を,自然調音状態(連続音声に含まれる定常部の音響特性に基づく規準を満たし,かつ自然な発話を行う際に観測され得る状態)と,不自然調音状態(音響特性の規準を満たすが,自然な発話を行う際に観測され得ない状態)に分類し,分類した調音状態を非線形空間に射影した。射影した調音状態を次元圧縮することにより,音声と一対多の関係にある調音状態の分布構造を可視化した。また,分布構造に基づき,異なる調音状態間の位置関係を定量化し,母音ごとの不自然調音状態の傾向を明らかにした。分布構造から得られた知見は,音声から調音状態を逆推定する際の新たな制約条件への利用が期待できる。
抄録全体を表示