音声コミュニケーション研究会資料

2021年9月音声コミュニケーション研究会資料

音声コミュニケーションを再考する

荒井隆行

2021 年 1 巻 1 号論文ID: SC-2021-1
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-1

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

日本音響学会では、2016 年に音声コミュニケーション調査研究委員会が発足した。その後、2017 年から研究発表会に音声コミュニケーションに関するセッションが登場し、現在に至っている。一方、2021 年からは音声コミュニケーション研究委員会として生まれ変わり、合わせて2021 年から音声コミュニケーション研究会がスタートすることとなった。本稿では、音声コミュニケーションに関わる活動の様子を振り返ると同時に、これからの音声コミュニケーションについてを再考する。

抄録全体を表示

PDF形式でダウンロード (2429K)
[招待講演]人と人、人と機械のコミュニケーション

－音声コミュニケーション研究への期待－

伊藤彰則

2021 年 1 巻 1 号論文ID: SC-2021-2
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-2

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

人間同士のコミュニケーションを分析的にとらえる研究は，通信技術の発達に伴って盛んに行われるようになってきた．初期には言語の媒体として見られていた音声モダリティであるが，技術の発達によって言語，パラ言語，心理状態，個人性などが分離できるようになった．本稿では，人間同士のコミュニケーションを，コンピュータネットワークのモデルであるOSI 参照モデルに当てはめてモデル化し，コミュニケーションの機能ごとの階層を明らかにする．また，それぞれの階層において，人間と機械のコミュニケーションのために何が実現されていて，何が実現されていないのかを明らかにする．最後に，今後の音声コミュニケーション研究への期待を語る．

抄録全体を表示

PDF形式でダウンロード (1781K)
市松音声と断続音声の知覚

上田和夫, 川上里以菜, 竹市博臣

2021 年 1 巻 1 号論文ID: SC-2021-3
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-3

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

原音声の半分が保持される条件で，時間軸で断続を行う断続音声と時間・周波数軸で断続を行う市松音声の了解度を調べ，比較した。断続音声の了解度は区間長が増加するに従って低下した。20 帯域の市松音声では，区間長にかかわらず100%近い了解度が得られた。しかし，2 ないし4 帯域の市松音声では，区間長160 ms で35%–40%まで低下する了解度の谷が見られた。時間・周波数区画ごとにパワーを平均化するモザイク音声刺激では，全般に了解度が著しく低下した（10%以下）。この結果は，時間・周波数領域に散在する音声知覚手がかりを聴覚が体制化する限界を表している。

抄録全体を表示

PDF形式でダウンロード (2088K)
遠隔構音検査システムの評価

-言語通級指導教室通級児童及び難聴児童の構音検査-

勝瀬郁代, 平島ユイ子

2021 年 1 巻 1 号論文ID: SC-2021-4
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-4

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

我々が開発した言語通級指導教室の児童のための遠隔構音検査システムによる遠隔構音検査の性能を,対面検査及びビデオ会議システムによる遠隔検査と比較した. 15名の児童に対し, 外部専門家と教員が対面検査と遠隔検査の両方の構音検査を行い,さらに各音素の診断確信度を評価した.その結果, 対面と遠隔検査間の診断一致度は十分に高かった.また,我々のシステムによる遠隔検査の診断確信度は,対面検査やビデオ会議システムによる遠隔検査よりも高かった.さらに, 重度の聴覚障碍のある15名の児童生徒を対象とした実験でも,対面検査と遠隔検査間で十分に高い診断一致度が得られ,聴覚障碍児の構音検査にも適用可能であることが示された.

抄録全体を表示

PDF形式でダウンロード (6431K)
音声認識結果に基づく言語特徴と音響特徴による音声感情認識

櫻井美咲, 小坂哲夫

2021 年 1 巻 1 号論文ID: SC-2021-5
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-5

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

本研究では，音響特徴と言語特徴の両方を用いた音声感情認識手法を検討した．言語特徴を用いた感情認識のためには感情音声を認識する必要がある．しかし感情音声認識は通常の音声認識に比べて難しいとされており，書き起こし文を用いた研究がほとんどである．感情的な音声の音響特徴は,非感情的な音声の音響特徴とは異なり，その特徴は感情の種類や強さによって大きく異なる．我々はこれまで音響モデル適応と言語モデル適応を組み合わせた感情音声認識手法を研究し，82.2%の高い単語認識精度を達成した．本研究では，音声認識結果から言語特徴を抽出し，その言語特徴と音響特徴を組み合わせて感情認識を行い，提案手法の有効性を示した．

抄録全体を表示

PDF形式でダウンロード (1773K)
サイドローブのない窓に基づく二種類の音源情報の表現について

河原英紀, 榊原健一, 矢田部浩平, 坂野秀樹, 森勢将雅

2021 年 1 巻 1 号論文ID: SC-2021-6
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-6

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

短時間Fourier 変換では、サイドローブが生ずる。サイドローブの無い窓関数を用いることで、様々な問題を回避することができる。ここでは、周期性に関連する二つの情報表現を紹介する。最初の表現は瞬時周波数に基づくものであり、基本波成分を選択する。短時間Fourier 変換を、対数周波数軸上で同形の重みを用いて加算することにより、周波数変調と振幅変調の大きさが最小になる仕組みを構成した。次の指標は、周波数軸上での周期性に基づくものであり、違う解像度の間の変化量に基づいて現象の繰り返しの時間間隔を調べる仕組みを構成した。

抄録全体を表示

PDF形式でダウンロード (2569K)
音声のスペクトル傾斜モデリングがIAIF に基づく声門流推定の精度に与える影響

平野雄大, モクタリパーハム, 森川大輔

2021 年 1 巻 1 号論文ID: SC-2021-7
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-7

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

IAIF に基づく正確な声門流の推定には，プリエンファシスの適用回数によって制御される音声のスペクトル傾斜が重要であることが示唆されている．様々な音声に対して，音声のスペクトル傾斜が声門流推定精度に与える影響を明らかにするために，声質，母音，F0 が異なる音声に対してプリエンファシスの適用回数を変化させて声門流を推定しその推定誤差を算出した．その結果，複数回プリエンファシスを適用することは声門流の推定に有効であることがわかった．また，最適なプリエンファシスの適用回数を決めるためのプリエンファシスフィルタ係数の閾値を算出した．

抄録全体を表示

PDF形式でダウンロード (1444K)
ケプストラム法を用いた音声障害の有無の判定の試み

石原一樹, 荒井隆行

2021 年 1 巻 1 号論文ID: SC-2021-8
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-8

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

機械学習を用いて, これまで様々な音声特徴量から音声障害の判別が行われてきた. 本研究では, 音声障害の評価指標として用いられるCepstral Peak Prominence (CPP) を使用し, 音声障害の有無の判定を試みた. CPP は, ケプストラムのピークの高さと, ピークにおけるケプストラムの回帰直線の高さとの差から求める特徴量である. 今回, Saarbruecken Voice Database (SVD)の音声データを使用し,サポートベクターマシン (SVM) で音声障害の有無の判定を行った. CPP を特徴量として分類を行った際, 76.21%の精度で分類が可能であった. また, CPP とメル周波数ケプストラム係数 (MFCC) を組み合わせることで, 最大81.03%の精度が出た. このことから, CPP は, 機械学習を用いて音声障害の有無を判定する際, 有効な音声特徴量であることが示された.

抄録全体を表示

PDF形式でダウンロード (1598K)
位置情報履歴を用いた人間とコミュニケーションロボットによる対話生成手法の検討

西田有希, 北村達也, 梅谷智弘

2021 年 1 巻 1 号論文ID: SC-2021-9
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-9

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

本論文では，人間とコミュニケーションロボットによる対話を円滑に行うために，位置情報履歴を用いて対話を生成し制御する手法を検討する．時期や個人の行動，スケジュール情報に沿った対話の内容を生成し，ロボットが，利用者が応答しやすく状況に応じた話題を提供することを目的とする．本稿では基礎検討として，システムの提案，対話システムの構築を行い評価した．システムの実装と実験を通して本手法の可能性と今後の課題を示す．

抄録全体を表示

PDF形式でダウンロード (1110K)
発話のしにくさの自覚と音読潜時，音節反復との関連の予備検討

古田尚久, 北村達也, 林良子, 能田由紀子, 鵜木祐史

2021 年 1 巻 1 号論文ID: SC-2021-10
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-10

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

健常な発話者の中の約3 割の人が発話のしにくさを自覚していると報告されている．本研究では，健常発話者の発話のしにくさの自覚に発話処理過程のどの段階が関与しているのかを，2 種類の音読潜時実験と，/ka/, /ta/の音節反復実験によって検討した．現時点で得られているデータからは，発話運動の指令・実行にかかわる音読潜時の結果が最も発話のしにくさの自覚との相関が強いこと，それに比して音節反復速度との相関は弱いことが予測された．今後は，実験を進めてデータ数を増やしていくとともに，発話のしにくさを考えるうえで，最も適切な発話過程モデルを検討していく予定である．

抄録全体を表示

PDF形式でダウンロード (2135K)
機械学習ライブラリを利用した超音波画像からの舌輪郭抽出の試み

的場瞳, 北村達也, 孫静, 林良子

2021 年 1 巻 1 号論文ID: SC-2021-11
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-11

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

超音波診断装置により撮影した舌運動の動画から機械学習を利用して舌輪郭の抽出を試みた.本研究では，Takemoto ら (2019) が MRI 動画の音声器官の輪郭抽出に用いている機械学習ライブラリ dlib のアンサンブル回帰木に基づく学習器を超音波画像に適用した.超音波診断装置の画面をキャプチャした動画からフレームを抽出し，目視にてトレースした.10 フレーム分のデータを用いて学習を試みたところ，おおむね良好な結果が得られ，dlib が超音波画像にも有効であることを確認できた.

抄録全体を表示

PDF形式でダウンロード (2467K)
オープンソース補聴器プロジェクトopenMHAの音声評価

安啓一, 小林敬, 佐藤正幸

2021 年 1 巻 1 号論文ID: SC-2021-12
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-12

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

オープンソース補聴器プロジェクトopenMHA は，これまであまり公開されることのなかった補聴処理を誰でも開発・検証に参加できるものにした。本報告ではopenMHA を動作させ，各種アルゴリズムの中から雑音抑圧処理に着目し，白色雑音を重畳した日本語VCV（母音–子音–母音）に対して処理を行なった。その結果，VCV 音声のSNR が改善した。しかし，聴覚障害者1 名による評価では聞き取りやすさと音質に差は見られなかった。今後は大学教育課程の中で補聴処理を学ぶために，カリキュラムの一部として本システムを用いた実習を組み込むことを目的とする。

抄録全体を表示

PDF形式でダウンロード (1998K)
EMA による日本語長母音の観察

白勢彩子, 北村達也, 能田由紀子

2021 年 1 巻 1 号論文ID: SC-2021-13
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-13

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

本稿では，EMA を用い，日本語の長母音の生成時における構音運動を捉えた。日本語はモーラリズムの言語とし知られ，「カコ（過去）」，「カッコ（括弧）」，「カッコー（郭公）」の3 語は，主に母音の長さ，子音の閉鎖区間の長さにより，味が弁別される。従来，これらの相違は持続時間や知覚などの面から検討されてきたが，発音の機構についてはほぼ未解明でる。我々は，共通語話者を対象に発話実験を実施して，舌，下歯茎，口唇の動きを観察した。その結果，短母音に比して，長音で動作が大きいことを確認した。他，構音運動が一定でなく，不安定であるなどもみられている。これらの構音運動を，模的に捉えることを試みたい。

抄録全体を表示

PDF形式でダウンロード (1908K)
プロの歌手と音楽大学の学生における歌い手のフォルマントの検討

高橋純

2021 年 1 巻 1 号論文ID: SC-2021-14
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-14

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

クラシック音楽において，優れた歌手の歌声に共通する音響的特徴として歌い手のフォルマントが存在する．本研究では，音高の変化と母音の変化を含む歌唱課題を作成し，プロの歌手と音楽大学で声楽を学ぶ学生の歌声に含まれる歌い手のフォルマントについて比較検討した．その結果，プロの歌手の方が歌声に含まれる歌い手のフォルマントの占有率が高く，その変化が少ないということが明らかになった．また，歌い手のフォルマントはi 母音が高くu 母音が低い傾向にあり， i からu に移行する際に，歌唱技術の差が現れやすいということが示唆された．

抄録全体を表示

PDF形式でダウンロード (1084K)
音素類似関係を用いた単語変形によるおかしみのある文の生成

高山宜之, 北村達也, 灘本明代

2021 年 1 巻 1 号論文ID: SC-2021-15
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-15

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

現在我々は漫才台本の自動生成システム，および，ロボットに演じさせる漫才ロボットの研究開発に取り組んでいる．これまで，漫才台本生成システムでは単語中のある1 文字を別の文字に変更する「言い間違えボケ」を提案してきた．言い間違える単語は様々な単語で言い間違える事ができるが，漫才では笑いを誘発する言い間違えの単語を選択する必要がある．そこで本論文では音素類似度を算出することができる音素類似関係に基づく単語変形手法を用いて，笑いを誘発する言い間違え単語の生成手法の提案を行う．さらに笑いを誘発する単語を含む文と音素類似の関係を評価する実験手法を提案する．

抄録全体を表示

PDF形式でダウンロード (1096K)
ロシア人学習者による日本語アクセント句の産出に関する一考察

木元めぐみ

2021 年 1 巻 1 号論文ID: SC-2021-16
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-16

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

本研究では、ロシア人学習者による日本語韻律習得について、平叙文中の名詞句におけるピッチ産出を対象にした調査結果を報告する。語アクセントが正しく産出できても文発話になるとそのアクセントが維持されなくなるという指導時の疑問から、語アクセントの正用産出についての聴覚判定とピッチ曲線上に現れたアクセント句のカウントによる分析を行った。対象者は、日本語母語話者のようにアクセント型を維持せず、名詞句後部にのみアクセントを置いて実現したものが圧倒的に多かった。これらがロシア語のイントネーション規則に準じている可能性から、目標言語である日本語に対して母語のイントネーションが用いられている可能性が示唆された。

抄録全体を表示

PDF形式でダウンロード (1908K)
韓国語の破擦音と摩擦音の時間的特徴

山川仁子, 天野成昭

2021 年 1 巻 1 号論文ID: SC-2021-17
発行日: 2021/09/22
公開日: 2024/02/15

DOIhttps://doi.org/10.60274/asjsc.SC-2021-17

研究報告書・技術報告書認証あり

抄録を表示する抄録を非表示にする

韓国語の破擦音・摩擦音の特徴を明らかにすることを目的とし，Yamakawa et al. (2012)の提案手法を用いて韓国語母語話者66 名が発声した韓国語の単音節14 種類の子音を解析した。その結果，摩擦部の立ち上がりの時間(x)と定常部+立ち下がり部の時間(y+z)の2 変数によって破擦音と摩擦音の判別が可能であり，その判別率は 89.9％であることが分かった。さらに，この2 変数によって破擦音の平音・濃音・激音もほぼ判別が可能であり，これらの子音の特徴がこの2 つの時間的変数によって表されることが示唆された。

抄録全体を表示

PDF形式でダウンロード (2573K)

J-STAGEへの登録はこちら（無料）