音声コミュニケーション研究会資料
Online ISSN : 2758-2744
3 巻, 2 号
選択された号の論文の7件中1~7を表示しています
2023年3月音声コミュニケーション研究会資料
  • 福島 侑希, 田島 基陽, 竹本 浩典
    2023 年 3 巻 2 号 論文ID: SC-2023-7
    発行日: 2023/02/24
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    CT データから抽出した鼻副鼻腔の幾何学的モデルの音響特性は,時間領域差分法により計算することができる.そしてその結果は,同じCT データから造形した声道の実体模型の音響特性を計測することで検証できる.ところがこの計測は成功していない.これは,狭い鼻孔から入力される測定用の音響信号が,声門では十分な信号対雑音比で観測されないためである.この問題を解決するために,本研究では振幅が大きい計測信号を出力可能なエクスポーネンシャルホーンと,壁振動を抑制するために壁を厚くした声道の実体模型を導入した.その結果,伝達関数を計測することに成功し,計算した伝達関数を評価することができた.評価の結果,声道の実体模型では副鼻腔の微細な構造を十分な精度で再現できていないことが示唆された.

  • 河原 英紀, 榊原 健一, 程島 奈緒, 坂野 秀樹, 北村 達也, 天野 成昭
    2023 年 3 巻 2 号 論文ID: SC-2023-8
    発行日: 2023/02/24
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    音声コミュニケーションは様々な音環境で行われる。音環境は知覚だけではなく発声にも影響を与える。 音環境の影響を実験的に調べるためにはそれらを制御可能な手段でシミュレートする必要がある。音環境を対話的に自由に操作する実時間処理を含むツールを実現することで、音声コミュニケーションに関わる音環境の影響についての暗黙知の獲得・蓄積が期待できるだけでなく、それらの影響を定量的に調べることが可能になる。ここでは、予備的な検討を進めているツールの概要と実装について紹介し、議論したい。

  • -日本語母語話者による予備調査の結果-
    レレトゥン , 島村 徹也, 鮮于 媚
    2023 年 3 巻 2 号 論文ID: SC-2023-9
    発行日: 2023/02/24
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    本研究は日本語の感情表現時の韻律特徴を明らかにし、第ニ言語習得時に応用することを目的とし、一語発話「ん」を用いた感情表現を調査した。調査は異なる文脈情に基づき発話をし、収録した。収録した音声データのF0 の値を分析した。結果は、F0 のダイナミックレンジが「Rise and Fall」である場合は、肯定的な感情表現で、「Gradual Fall」は、否定的な感情表現、疑いの表現では、「Rise」である可能性が示唆された。今後、日本語学習者を含む知覚および生成調査を行い、検証する予定である。

  • 安田 茉, 北村 達也
    2023 年 3 巻 2 号 論文ID: SC-2023-10
    発行日: 2023/02/24
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    アニメーション作品やゲームのキャラクタとその声を担当する声優の声質とのミスマッチによる違和感を減らすため,女性声優の声質を表現する語を抽出した.女性声優の声質を表す様々な表現語を収集し,それらの了解性,同義性,類似性を調査し,クラスタ分析によって「大人っぽい声-幼い声」,品な声-荒々しい声」,「優しい声-冷たい声」,「元気な声-おしとやかな声」,「高い声-低い声」の5 対の声質表現語対を得た.

  • 袖谷 紳太郎, 鈴木 基之
    2023 年 3 巻 2 号 論文ID: SC-2023-11
    発行日: 2023/02/24
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    近年,雑談対話システムの研究分野において,GPT を用いる方法が注目されている.この方法では,状況や対話履歴等をGPT に入力することで,応答を自動生成することができるが,必ずしも自然な応答を生成できるわけではなく,文脈と矛盾したり,対話相手の立場のような発言を生成したり,といった誤りを起こす場合がある.そこで,GPT から複数の応答候補文を生成し,この中から別のモデルを使って適切な応答文を選択する方法が提案されて いる.本論文ではSentenceBERT を特徴抽出器として利用し,少量のデータで再学習させることで,文脈に矛盾しない事,発話者の立場をとり違えない事を判定するモデルを作成し,その性能評価を行った.

  • 金澤 尚希, 鈴木 基之
    2023 年 3 巻 2 号 論文ID: SC-2023-12
    発行日: 2023/02/24
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    近年,唇動画像からの音声生成を行う研究は数多く行われている.従来の手法ではCNN やRNN を用いたDNN モデルで音声波形の生成を行っているものが多い.その場合,入力となる唇動画像には肌の色やホクロといった話者固有の特徴を学んでしまい,学習話者以外の話者のデータを入力とする場合には性能が低下してしまう.そこで,学習話者以外の話者においても高い性能で音声波形を生成するために,入力特徴量から話者固有の特徴を取り除く手法を提案した.本稿では提案した入力特徴量を用いて音声波形を生成し,それらを客観評価値STOI を用いて評価した.結果として,提案した手法では唇動画像を入力した場合に比べ性能は劣化したが,話者の違いによる劣化を抑えることができる効果を確認した.

  • 加藤 凪咲, 白勢 彩子
    2023 年 3 巻 2 号 論文ID: SC-2023-13
    発行日: 2023/02/24
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    文章を読む行為の中でも特に「初読」は、文章との最初で最後の出会いであり、単元の最初で文章をどのように読むのかという初読方法は特にその効果や目的について考えることが求められると考えられる。そこで、本研究では、初読に焦点を当て、音読、黙読のうち、実際の教育現場においてどのような初読方法が一般的であるのか、また、初読方法をどのように選択・判断しているのかについて調査することを目的として、教科書の教師用指導書の調査と、国語科教員に対するアンケート調査を実施して、結果を報告する。

feedback
Top