音声コミュニケーション研究会資料
Online ISSN : 2758-2744
3 巻, 4 号
選択された号の論文の9件中1~9を表示しています
2023年9月音声コミュニケーション研究会資料
  • 村中 誠司, 重枝 裕子, 杉田 創, 伊藤 正哉
    2023 年 3 巻 4 号 論文ID: SC-2023-18
    発行日: 2023/09/14
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    本研究では、うつ病重症度の評価面接GRID-HAMD を受けている患者の音声を解析し、うつ症状の重症度で分類できるかを試みた。本発表では、その途中経過を報告する。臨床心理学では、精神疾患のアセスメント手法を探索しており、音声を使った症状評価も注目されている。世界的にもまだその試みが少なく、精度向上やうつに関連する音声特徴は十分に明らかとなっていない。本研究では、97 名分の4 時点の評価面接の音声を用いて、各時点のGRID-HAMD 得点の分類モデルを構築した。その結果、現状ではAccuracy は0.52、F1-score は0.49 の性能であり、実運用に現状では耐えられないものであることが確認された。分類には、spectral contrast やMFCC が寄与することが確認された。

  • 西山 開貴, 川波 弘道
    2023 年 3 巻 4 号 論文ID: SC-2023-19
    発行日: 2023/09/14
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    日常生活において疲労感を抱くことは避けられない.また,昨今では2020 年の新型コロナウイルス流行を皮切りに生活様式が変化したことに伴い,長時間の電子機器の利用が増加している.これらはさらに日常生活における疲労感の原因となり,生活に影響を及ぼす可能性が高い.そこで,疲労度を推定するシステムが有用ではないかと考え,疲労によって特徴が表れやすい表情と音声発話に着目した.本研究では,音声認識と画像認識の技術を用いて,利用者が肉体的あるいは精神的にどの程度疲労しているかの推定を行い,その結果を画像や音声によって表示して必要に応じて休憩を促すシステムの開発を目指す.本報告では提案するシステムの概要と,疲労時の母音と音素バランス文発声を用いた予備的な識別実験の結果を報告する.

  • 嵯峨山 茂樹
    2023 年 3 巻 4 号 論文ID: SC-2023-20
    発行日: 2023/09/14
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    音声分析における基本的な問題を再考し、有声音のスペクトル包絡推定が内包する根源的問題を議論し、音声分 析が満たすべき要求条件を確認したのち、周期信号の周期の3 倍以上の整数倍長の時間窓としてvon Hann 窓やHamming 窓などを用いると、パワーと調波パワー値(すなわちスペクトル微細構造の山の値)が音声波形と窓との相対位置関係に対して不変にできることと、時間窓の実効長を自由に設定できることなどを示す。また、調波スペクトルからソース・フィルタモデルにおけるフィルタ特性の推定の方法について、単一フレームで行う方法と多フレームからの学習的な方法について試論を述べる。

  • 無響・残響下の比較
    辻 慎也†, 荒井 隆行
    2023 年 3 巻 4 号 論文ID: SC-2023-21
    発行日: 2023/09/14
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    本研究では,一側性難聴者 (UHL) と両側聴力正常のモノラル受聴 (MNH) ・両耳聴 (BNH) を対象に,無響下・残響下での文章了解度・方向性マスキング解除 (SRM) を測定した。文章了解度テストの結果,BNH ではその影響が有意でなかった一方,UHL・MNH で残響は音声明瞭度を有意に上昇させる要因と推定された。BNH と比べ,MNH・UHL では音声が健聴側に位置したときのSRM の効果が少なく,音声が患耳側に位置したときSRM は負の値を取った。一方,MNH と比べ,UHL は残響下である程度energetic masking から解除され,SRM の度合いに改善がみられ,モノラル受聴でのキューへの適応によって一側性難聴者の聴取は改善されると示唆された。

  • クラウドソーシングを用いた印象評価データによる検討
    浅井 拓也, 菊池 英明, 神長 伸幸
    2023 年 3 巻 4 号 論文ID: SC-2023-22
    発行日: 2023/09/14
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    我々はインサイドセールスの音声における音響特徴を研究し, その知見を, 営業成績の推定や商談会話のための発話訓練に活用することを目指している. 本研究では, インサイドセールス場面を対象に音声の印象推定モデルを構築した. 言語的情報の統制のため, 模擬商談音声を収集し, クラウドソーシングを用いて音声の印象評価を行った. 印象評価結果を観察したところ, 努力の最小化と呼ばれる行動をとる評価者が存在した. そのため, 本研究では評価時間や一致率, 標準偏差などから評価者の選定を試みた. 検討の結果, 評価時間による評価者選定を行うことで印象推定モデルの精度が向上することが確認された.

  • 日本語日常会話コーパスを用いた検討
    宮澤 幸希, 佐藤 可直
    2023 年 3 巻 4 号 論文ID: SC-2023-23
    発行日: 2023/09/14
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    我々は人と機械との円滑な対話の実現のために、パラ言語的メッセージを取り扱える対話システムの実現を目指している。現在、ユーザがシステムを制御するために必須と考える4 種類の韻律的態度(肯定・否定・疑問・考え中)の認識モデルを開発している。本稿では、はじめに、読み上げられた音声(演技音声)と日常会話音声のコーパスを比較して、これらの韻律的態度の音響的特徴がどのように異なるかを観察する。続いて、読み上げ音声で訓練したモデルでは認識困難な韻律的態度のパターンを明らかにし、日本語日常会話コーパスを使ったモデルの追加訓練によってこれらのパターンに対する認識率が改善したことを報告する。

  • 鈴木 良平, 網野 加苗, 荒井 隆行
    2023 年 3 巻 4 号 論文ID: SC-2023-24
    発行日: 2023/09/14
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    本研究では,日本語母語話者30 名を対象に,SN 比を3 段階(SNR = ∞,0 dB, -10 dB) に設定した2 種類の雑音を用いて,5 名の未知話者の2 種類の単語音声による話者識別の聴取実験を行った.この結果を基に,刺激ペア間の基本周波数(F0) 差と識別正答率の関係について,雑音の有無や雑音の程度による影響を分析するため,線形単回帰分析を行った.線形単回帰分析で推定された各パラメータを統計的に検定したところ,雑音下では非雑音下に比べ話者認識にF0 が寄与する可能性,雑音の程度によって寄与の程度が変化しない可能性があることが確認された.

  • 準備・録音・分析など
    河原 英紀, 榊原 健一, 水町 光徳, 矢田部 浩平, 北村 達也, 森勢 将雅
    2023 年 3 巻 4 号 論文ID: SC-2023-25
    発行日: 2023/09/14
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    記録する音声資料をできるだけ価値があるものとする方法を検討している。そのような試みの一つとして、 2019 年に講習会を開催した。しかし、その講習会で紹介した内容の幾つかは、その後の技術の発展と検討により陳腐化しただけではなく、誤りであることが明らかになっている。ここでは、それらの発展と問題について説明し、新しい講習会をどのような内容・形式にすべきか議論したい。

  • 深層に記憶された曲を想起して
    杉本 亨, 恒川 亜衣子, 山路 裕子, 野口 夏菜, 津田 眞壽, ふらんちぇすか , 山之内 里衣
    2023 年 3 巻 4 号 論文ID: SC-2023-26
    発行日: 2023/09/14
    公開日: 2024/02/15
    研究報告書・技術報告書 認証あり

    絶対音感がないと、ドとかレとかの正しい音高を再現するのは難しいが、記憶に残っている音源がオリジナルのままであれば、それを思い出すことによりその音高を再現できることになる。そこで、記憶に残るメロディーを想起することにより、それがオリジナルのままか否か、違う曲があれば、それはどういう場合かを検討した。結果、好きで普段よく思い出したり歌ったり演奏していた曲よりも、好きでもないが頭にこびりついてしまっていた曲や、声楽よりも楽器の音の方がオリジナルのまま再現できる可能性が高いことが分かった。また、絶対音感はなくても脳内で自在にキー変換して音楽を再現、楽しむことができることより、脳の偉大さを再認識した。

feedback
Top