多段解析法による形態素解析を用いた音声合成用読み韻律情報設定法とその単語辞書構成

浅野 久子; 松岡 浩司; 高木 伸一郎; 小原 永

doi:10.5715/jnlp.6.2_59

抄録

日本語テキスト音声合成において, 自然で聞きやすい合成音声を出力するためには, 読み, アクセント, ポーズ等の読み韻律情報を正しく設定する必要がある. 本論文では, 複合語等に対しては部分的に深い解析を行うことを特徴とする多段解析法に基づく形態素解析を用いて, 読み韻律情報を設定する方法, および, 読み韻律情報を設定するために用いる単語辞書情報について述べる. 本方式の主な特徴は, 形態素解析における読み韻律情報付与に対応した長単位認定, 複合語内意味的係り受け情報を用いたアクセント句境界設定, 文節問係り受け情報を用いず, 複合語内等の局所構造, およびアクセント句境界前後単語の品詞情報等から得られるアクセント句結合力を用いて段階的にポーズを設定する多段階設定法に基づくポーズ設定である. 本方式をニュース文章を対象に2名の評価者により評価した結果, クローズ評価で95%, オープン評価で91%の精度 (評価者2名の平均) で, 読み韻律情報を正しく設定でき, その有効性が確認できた.

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）