抄録
人間が複合音の音高をいかにして知覚するかという問題は, 聴覚理論の中で現在なお解決されていない重要な問題である. 現時点で最も有力とされている音高知覚理論には次の3つがある. Wightman(1973)の「パターン変換理論」, Goldstein(1973)の「最適処理理論」, およびTerhardt(1974)の「虚音高理論」がそれである. 本論文において, これら3つの音高知覚理論の数学的関連づけを行い, さらにTerhardtのモデルを発展させた「一般化線形音高知覚モデル」を考え, そのモデルの中心となる「テンプレート関数」の音高実験データからの決定法を議論する. de Boer(1977)はGoldsteinのモデルを出発点として他のモデルとの関連づけを行ったが, 本論文ではTerhardtのモデルを一般化し変形することでモデル間の関係をより明解に示すことができた. その結果, WightmanのモデルとTerhardtのモデルとは数学的には全く同じ線形モデルで, ただモデルパラメータが異なるにすぎないことがわかった. 従って一般化したTerhardtのモデルを用いれば, この2つの線形変換モデルを個別に扱う必要はない. これに対してGoldsteinのモデルは統計的最尤推定法を用いた非線形変換モデルで, 他の2つの線形変換モデルとは本質的に異なっている. このモデルは最適推定音高値付近では線形変換モデルとほぼ似かよった音高予測を示すがこれからはずれると予測が大きく異なる. これはGoldsteinのモデルにのみ連続倍音次数の制約が付加されているためである. Goldsteinのモデルは音高実験データに基づいたモデルパラメータにより作られているために定量的な予測が可能であるのに対して, 2つの線形モデルは定量的な予測に弱い. これはモデルの中に聴覚末梢系におけるスペクトル情報パターンという観測不可能な量が存在しており, これを一意的に定めることができないためである. 従って, モデルより末梢のスペクトル情報パターンを排した新しい「一般化線形音高知覚モデル」を考案した. この新しい線形モデルの中心となる「テンプレート関数」は, 従来の音高実験データより推定することができる.