Web文書の統計情報に基づく連語Ngram音声認識に関する検討

高橋 伸弥; 森元 逞

doi:10.11527/jceeek.2011.0_322

抄録

本研究では，予め用意された字幕文字列と映像中の音声との対応付けを自動的かつ高精度に実現するために，字幕文字列から音声認識用Ngram言語モデルを作成する方法について検討する．一般にNgram言語モデルは大量の学習用コーパスを必要とするため，極めて少量の字幕文字列テキストからでは統計量を学習することが困難である．そこで，本研究ではGoogleNgram統計言語資料を利用して，字幕文字列の言語モデルを作成する方法を提案し，さらに複数の単語から成る定型的な表現（連語）を単位とすることで精度を向上させることを試み，実験により提案手法の有効性を検討した．

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

TMAOase, trimethylamine-N-oxide demethylase, is a thermostable and active enzyme at 80°C
Introduction of Seismic Data Acquisition System
Current Situations and Issues of Nature School in the City
第一次世界大戦後の吉野作造の中国論
Adsorption Properties of As(III) and Cr(VI) in Water Environment by Calcined Gibbsite

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）