抄録
本研究では,予め用意された字幕文字列と映像中の音声との対応付けを自動的かつ高精度に実現するために,字幕文字列から音声認識用Ngram言語モデルを作成する方法について検討する.一般にNgram言語モデルは大量の学習用コーパスを必要とするため,極めて少量の字幕文字列テキストからでは統計量を学習することが困難である.そこで,本研究ではGoogleNgram統計言語資料を利用して,字幕文字列の言語モデルを作成する方法を提案し,さらに複数の単語から成る定型的な表現(連語)を単位とすることで精度を向上させることを試み,実験により提案手法の有効性を検討した.