電気関係学会九州支部連合大会講演論文集
平成24年度電気関係学会九州支部連合大会(第65回連合大会)講演論文集
セッションID: 06-1A-15
会議情報

日本語話し言葉コーパスを用いた連語Ngram音声認識の検討
*高橋 伸弥森元 逞
著者情報
会議録・要旨集 フリー

詳細
抄録
一般に音声認識では,2単語もしくは3単語の連接確率を定義した統計的言語モデルが用いられている.しかし実際に使われる日本語表現においては,定型的な文末表現や熟語表現,慣用句など4単語以上の単語が連接した表現が数多く現れる.これらの確率を学習することは,膨大な学習コーパスが必要なこと,また音声認識処理の計算量が増大することなどから,実用的ではないとされてきた.そこで本研究では,日本語話し言葉コーパスに現れる表現のうち,高頻度かつ定型的な複単語表現(連語)を,Google日本語Ngram統計言語資料を用いて抽出し,それらを統計的言語モデルに組み込む方法について検討する.
著者関連情報
© 2012 電気関係学会九州支部連合大会委員会
前の記事 次の記事
feedback
Top