電気関係学会九州支部連合大会講演論文集
平成23年度電気関係学会九州支部連合大会(第64回連合大会)講演論文集
セッションID: 05-2A-05
会議情報

Web文書の統計情報に基づく連語Ngram音声認識に関する検討
高橋 伸弥森元 逞
著者情報
会議録・要旨集 フリー

詳細
抄録
本研究では,予め用意された字幕文字列と映像中の音声との対応付けを自動的かつ高精度に実現するために,字幕文字列から音声認識用Ngram言語モデルを作成する方法について検討する.一般にNgram言語モデルは大量の学習用コーパスを必要とするため,極めて少量の字幕文字列テキストからでは統計量を学習することが困難である.そこで,本研究ではGoogleNgram統計言語資料を利用して,字幕文字列の言語モデルを作成する方法を提案し,さらに複数の単語から成る定型的な表現(連語)を単位とすることで精度を向上させることを試み,実験により提案手法の有効性を検討した.
著者関連情報
© 2011 電気関係学会九州支部連合大会委員会
前の記事 次の記事
feedback
Top