人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
97回 (2023/2)
会議情報

第二言語学習者のためのMelGAN-VCを用いた音声変換手法の検討
森 清忠三好 康夫
著者情報
会議録・要旨集 フリー

p. 01-04

詳細
抄録

YouTube等の動画共有サイトには様々な言語の動画が数多く投稿されており,第二言語学習者が視聴することで聞き取りの練習になることが期待できる。しかし,公開されている動画の多くはリスニング教材として制作されたものではないため,話者によっては特徴的なアクセント等を持ち,そのままでは学習者にとって聞き取りづらい動画も多い。そのため学習者は再生速度を聞き取り可能な速さに調整する方法をよく用いる。本研究では,速度調整との併用によりさらなる足場かけの効果を実現するために,動画内の話者のアクセントを学習者が母国語のアクセントに近付けて聞き取りやすい音声に調整できる環境の提供を目指す。そのための音声変換手法として敵対的生成ネットワーク(GAN)等を用いることを検討し,MelGAN-VCで音声を変換する実験を行った。その結果,ノイズを学習者が気にならない程度に抑えることは困難であることが確認された。

著者関連情報
© 2023 人工知能学会
次の記事
feedback
Top