抄録
最近,多量のディジタル電子画像をパソコンで管理する機会が多くなった.多量な画像データを管理する場合,画像に付随した情報を音声データで付加しておくと,画面上に文字を表示することなく音による画像の状況説明が可能となる.このような音声処理は,音と画像を媒体の別領域に記録するのが理想的ではあるが,画像の編集を行う際に音情報の領域も併せて編集しなくてはならなくなる.
そこで今回,画質の劣化を極力抑えながら画像内に直接音声データを埋め込むことを検討した.音情報は8ビットで量子化して2ビット単位以下のビットプレーンに分解し,2×2画素の画像エリアに対し,人間の目が最も鈍感なB信号に6ビットの情報を,また赤信号には2ビットの情報を埋め込んだ.その結果,約10秒程度の音声信号を録音できる見通しを得た.