主催: 一般社団法人 人工知能学会
会議名: 2018年度人工知能学会全国大会(第32回)
回次: 32
開催地: 鹿児島県鹿児島市 城山ホテル鹿児島
開催日: 2018/06/05 - 2018/06/08
近年深層学習を用いた自己回帰生成モデルは音声合成の性能を向上させている. しかし,自己回帰生成モデルに基づいた音声合成システムに表現の豊かさを備えさせることは,自己回帰生成モデルが話者性,話し方といった音声の大域的な特徴を学習するのが苦手であることから,まだ未解決の問題となっている. 本稿では,VAEと自己回帰モデルの一つであるVoiceLoopを統合したモデルVAE-Loopを提案する.従来の自己回帰生成モデルに基づいた音声合成モデルと違い,提案手法は音声の大域的な特徴をVAEによって明示的にモデル化することができる. VCTKやBlizzard2012を用いた実験では,VAEが学習した大域的な特徴を用いることで,VoiceLoopがより高品質な音声を生成すること,及び表現をコントロールできることを示す.