抄録
自然な対話発話などでは,フィラーなどの意味のない語彙(以下,「無意味語」)が挿入されることが多く,また種々の場所に挿入される可能性がある.そのため性能の良いNグラム言語モデルを構築することが困難となっている. 本論文では,フィラーなどの無意味語を音節単位のNグラムでモデル化し,これを無意味語なしの(通常語だけからなる)テキストから構築したNグラムに追加する方法を提案する.またこのNグラムを用いた音声認識実験を行なった結果を報告する.今回は小規模な実験であるため本手法が有効であると結論するまでには至っていないが,かなり有望であるとの見通しを得た.