テレビジョン学会技術報告
Online ISSN : 2433-0914
Print ISSN : 0386-4227
15 巻 , 54 号
選択された号の論文の8件中1~8を表示しています
  • 原稿種別: 表紙
    1991 年 15 巻 54 号 p. Cover1-
    発行日: 1991/09/27
    公開日: 2017/10/06
    研究報告書・技術報告書 フリー
  • 原稿種別: 目次
    1991 年 15 巻 54 号 p. Toc1-
    発行日: 1991/09/27
    公開日: 2017/10/06
    研究報告書・技術報告書 フリー
  • 大倉 計美, 杉山 雅英
    原稿種別: 本文
    1991 年 15 巻 54 号 p. 1-6
    発行日: 1991/09/27
    公開日: 2017/10/06
    研究報告書・技術報告書 フリー
    セグメント特徴量を用いた離散分布型HMM音声認識(SQ-HMM)を検討し、1)音素カテゴリ別に作成するカテゴリ依存作成方法と、2)認識対象となる音声資料またはそれに近い発話様式をもつ音声資料から作成する発話様式依存作成方法の2方法により作成したSQコードブック(Segment Quantization codebook)を用いた発話様式依存SQ-HMMが、VQ-HMMよりも雑音環境下での音声認識性能が優れていることを示す。単語より切り出した18子音認識実験において、SQ-HMMはVQ-HMMよりもSNR=∞、30dB及び20dBの環境において3.9%、8.2%及び9.1%高い認識率を示した。また、SQ-HMMはSNR=∞、30dB及び20dBの環境において, 文節認識実験で88.2%、84.2%、52.7%の認識率を示し、VQ-HMMよりも0.7%、10.0%、11.5%高い認識率を示した。
  • D. Rainton, S. Sagayama
    原稿種別: Article
    1991 年 15 巻 54 号 p. 7-13
    発行日: 1991/09/27
    公開日: 2017/10/06
    研究報告書・技術報告書 フリー
    It is common practice to pre-orthogonalise data prior to training diagonal covariance continuous mixture density Hidden Markov Models (HMMs); this data orthogonalisation process is typically seen as being separate and distinct from the HMM training itself. Thus training is a two stage process, first the data is orthogonalised via a linear transformation, and then the HMM parameters are re-estimated using this pre-orthogonalised data. In this paper we provide an alternative interpretation; we show that observation vector orthogonalisation can be interpreted as simply another form of HMM mixture tying. Hence an HMM trained using orthogonalised data is identically equivalent to a form of tied HMM. Extending the basic orthogonalisation scheme described above we introduce a model dependent observation vector orthogonalisation algorithm, where each HMM is associated with its own separate model dependent orthogonalisation matrix. Using the theoretical framework described above, the corresponding tied mixture interpretation is derived. Finally, experimental results are presented comparing all of the various approaches on a common Japanese phoneme recognition task.
  • シンガー ハラルド, 嵯峨山 茂樹
    原稿種別: 本文
    1991 年 15 巻 54 号 p. 15-20
    発行日: 1991/09/27
    公開日: 2017/10/06
    研究報告書・技術報告書 フリー
    本論文では、ピッチとスペクトルの相関を利用して、ピッチ情報を音素HMMのパラメータに反映させた新しい音声認識手法を提案する。本手法は、ピッチを利用した従来の手法とは異なり、ピッチパターンは直接利用せず、ピッチとスペクトルの間に存在する相関関係を用いて、スペクトルパラメータをフレーム毎に正規化して使用することを特徴としている。これによって音素認識性能の向上に直接結び付くと考えられるいくつかの効果が得られた。更に、連続発声された日本語音声中の24音素に対する認識実験では、ピッチ情報によるスペクトルパラメータの正規化を行なわない場合に比べて、誤認識率が8%減少することが分かり、本手法の有効性を確認した。
  • 水田 忍, 中島 邦男
    原稿種別: 本文
    1991 年 15 巻 54 号 p. 21-28
    発行日: 1991/09/27
    公開日: 2017/10/06
    研究報告書・技術報告書 フリー
    辞書自動生成に基づく不特定話者大語彙認識方式の開発を目的として、音素片を記述単位としたHMMによる認識手法について開発を進めている。本報告では、特に不特定話者認識に有効な混合連続分布HMMに関する、モデル間の識別能力を考慮した最適識別学習法(ODT)について述べる。まず、認識対象と同じ語彙の単語データを学習に用いた場合の識別性能の向上を示す。また、学習データセットのアンバランスによる影響についても検討する。次に、認識語彙外データを用いた学習に関し、語彙に依存しない小単位音声データを用いることの効果について検討する。最後に、疑似認識語彙データを用いて認識語彙の音韻対立関係を小単位音声での学習に反映させた場合の性能向上について述べる。
  • 坪田 明子, 飯島 伸一, 曽禰 元隆, 光井 英雄, 吉田 征夫
    原稿種別: 本文
    1991 年 15 巻 54 号 p. 29-36
    発行日: 1991/09/27
    公開日: 2017/10/06
    研究報告書・技術報告書 フリー
    不特定話者の音声認識を日本語の5母音について、ニューラネットワークを用いて行った。学習認識を行う際の入力データは、音声波形をFFT解析し自乗平均表示したパワースペクトルとした。従って入力データはFFT解析によるばらつきと、個人量によるばらつきを持ち合わせていることになる。このようなばらつきは学習認識に影響を与えるものであるが、学習データを工夫することにより影響を最小限に抑えられ多入力-出力が可能であることがわかった。実際の認識率は5母音平均で94.4%が得られた。極簡単な前処理の入力データを用いニューラルネットワークが3層であることを考慮するとかなりの高認識率であると思われる。
  • 原稿種別: 付録等
    1991 年 15 巻 54 号 p. App1-
    発行日: 1991/09/27
    公開日: 2017/10/06
    研究報告書・技術報告書 フリー
feedback
Top