人工知能学会全国大会論文集
Online ISSN : 2758-7347
第35回 (2021)
セッションID: 4I2-GS-7c-02
会議情報

StarGAN-VCを用いた話者非依存音響特徴量抽出と二重分節解析への応用
*小村 漱一朗林 楓谷口 彰谷口 忠大亀岡 弘和
著者情報
会議録・要旨集 フリー

詳細
抄録

教師なし学習によって連続的音声から音素および語彙の獲得を行う手法の一つに二重分節構造解析器 (Nonparametric Bayesian double articulation analyzer: NPB-DAA) がある.NPB-DAAでは音響特徴量の話者依存性は複数話者からなる音声データセットの学習において問題とされる.本研究の目的はStar generative adversarial network for voice conversion (StarGAN-VC) を話者非依存音響特徴量の抽出を行うモデルとして活用し,Neuro-SERKERTを用いたNPB-DAAとStarGAN-VCの相互学習による最適化が可能な統合モデルの構築を行うことである.NPB-DAAとStarGAN-VCの統合モデルにおける相互学習の有効性について実験を通して検証を行った.

著者関連情報
© 2021 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top