人工知能学会全国大会論文集
Online ISSN : 2758-7347
第32回 (2018)
セッションID: 2N1-01
会議情報

変分自己符号化器を用いた表現の多様性のモデル化による表現豊かな音声合成
*阿久澤 圭岩澤 有祐松尾 豊
著者情報
会議録・要旨集 フリー

詳細
抄録

近年深層学習を用いた自己回帰生成モデルは音声合成の性能を向上させている. しかし,自己回帰生成モデルに基づいた音声合成システムに表現の豊かさを備えさせることは,自己回帰生成モデルが話者性,話し方といった音声の大域的な特徴を学習するのが苦手であることから,まだ未解決の問題となっている. 本稿では,VAEと自己回帰モデルの一つであるVoiceLoopを統合したモデルVAE-Loopを提案する.従来の自己回帰生成モデルに基づいた音声合成モデルと違い,提案手法は音声の大域的な特徴をVAEによって明示的にモデル化することができる. VCTKやBlizzard2012を用いた実験では,VAEが学習した大域的な特徴を用いることで,VoiceLoopがより高品質な音声を生成すること,及び表現をコントロールできることを示す.

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top