2022 年 2 巻 2 号 論文ID: SC-2022-9
モザイク音声(原音声を周波数・時間平面上で一定の区画に区切ってパワーの平均値を 計算し,雑音駆動した音声) と,モザイク音声を一定(40-320 ms) の劣化区間に分け,劣化区間内 のモザイク区間(20-80 ms) の順序をランダムに入れ替えた局部時間ランダマイズ・モザイク音声 の了解度を中国語と日本語で比較した。天井効果が表れる劣化区間長40 ms の条件を除き,いずれ の言語でも局部時間ランダマイズ・モザイク音声の方が同じ劣化区間長のモザイク音声より了解度 が高かった。このことから,言語に関わらず,長い時間窓(250 ms 程度) から得られる大まかな情 報と,短い時間窓(20-30 ms 程度) から得られる細かい情報とが統合されて音声が知覚されるとい