主催: 人工知能学会
会議名: 第97回研究会言語・音声理解と対話処理研究会
回次: 97
開催地: 東海大学湘南キャンパス
開催日: 2023/03/08 - 2023/03/09
p. 01-04
YouTube等の動画共有サイトには様々な言語の動画が数多く投稿されており,第二言語学習者が視聴することで聞き取りの練習になることが期待できる。しかし,公開されている動画の多くはリスニング教材として制作されたものではないため,話者によっては特徴的なアクセント等を持ち,そのままでは学習者にとって聞き取りづらい動画も多い。そのため学習者は再生速度を聞き取り可能な速さに調整する方法をよく用いる。本研究では,速度調整との併用によりさらなる足場かけの効果を実現するために,動画内の話者のアクセントを学習者が母国語のアクセントに近付けて聞き取りやすい音声に調整できる環境の提供を目指す。そのための音声変換手法として敵対的生成ネットワーク(GAN)等を用いることを検討し,MelGAN-VCで音声を変換する実験を行った。その結果,ノイズを学習者が気にならない程度に抑えることは困難であることが確認された。