電気関係学会九州支部連合大会講演論文集
2024年度電気・情報関係学会九州支部連合大会(第77回連合大会)講演論文集
セッションID: 07-1P-06
会議情報

F0制御可能な複数話者ボコーダへの話者ベクトルの導入
*秋吉 真吾古家 賢一水野 秀之
著者情報
会議録・要旨集 フリー

詳細
抄録

近年、ボコーダに深層学習を取り入れたニューラルボコーダが注目を集めている。とりわけ、ソース・フィルタモデルを導入したニューラルボコーダは柔軟なF0制御が可能である。複数話者の音声データを学習に用いた複数話者ボコーダでは、少量の学習用音声データで目標話者の音声を合成することが可能な一方で、単一話者で学習したモデルよりも品質が劣化する課題がある。本研究では複数話者学習によるニューラルボコーダの合成音声の品質を向上するために、ソース・フィルタモデルを導入したニューラルボコーダに話者ベクトルを追加入力する手法を提案する。評価実験を行い、提案手法が従来手法と比べて音声品質が向上したことを確認する。

著者関連情報
© 2024 電気・情報関係学会九州支部連合大会委員会
前の記事 次の記事
feedback
Top