-
佐藤 志貴, 佐々木 裕多, 岩田 伸治, 山崎 天, 小室 允人, 守屋 彰二, 大萩 雅也, 菊池 浩史, 楊 潔, 邊土名 朝飛, 斉 ...
原稿種別: 研究会資料
p.
01-08
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
対話システムライブコンペティションとは,オーディエンスの前で実際に対話システムを動作させ評価を行うイベントである.過去6回にわたる成功を受け,第7回となる「対話システムライブコンペティション7」を開催した.前回と同様,今回もマルチモーダル対話システムに焦点を当てた.今回のコンペティションは,シチュエーショントラックとタスクトラックの2つで構成される.シチュエーショントラックでは,特定のシナリオにおいて人間らしい対話を実現するシステムの開発を目指し,タスクトラックでは,複雑で高度な問題においてタスク完遂が可能な対話システムの構築に取り組む.予選では,シチュエーショントラックに14チーム,タスクトラックに8チームが参加した.本稿では,イベントの概要を紹介するとともに予選の結果を報告する.
抄録全体を表示
-
小方 雅子, 中村 勇理, 有馬 士央, 菊池 浩史
原稿種別: 研究会資料
p.
09-12
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本稿では、対話システムライブコンペティション7シチュエーショントラックで開発した、対話システムに採用した制御および対話戦略について報告する。コンペティションでは、ユーザの愚痴を聞き、決断を後押しするシステムの開発が求められた。ユーザの愚痴を掘り下げて聞くためには、ユーザの自己開示を促すことが重要である。そこで本研究では、ユーザに肯定的かつ共感的な関心を積極的に示す制御指針として、システムにいわゆる「ギャル」と呼ばれるキャラクタ性を付与した。さらに、システムがユーザの決断を後押しするための戦略として、ユーザの感情に対する気づきや関わり方についての学びが期待されるロールプレイを採用した。その結果、コンペティションの予選で6位の結果を得た。
抄録全体を表示
-
花川 主税, 山元 広太, 小堀 聡太, 藤江 真也
原稿種別: 研究会資料
p.
13-18
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
相手の愚痴を聞きながら決断の後押しをする音声対話システムにおける,大規模言語モデルに与えるプロンプトの設計について報告する.本システムでは,対話を3つのフェーズ(愚痴の傾聴,決断の後押し,その他雑談)に明示的に分割した.フェーズごとにシステムが意識すべき情報をスロットという形で整理し,システム行動の一貫性向上や適切なフェーズ遷移を実現した.また,話し手の発話内容を表層的に捉えるだけでなく,その背後にある感情を逐次推定し,それに応じた応答を生成するようにした.これにより,システムの共感や質問などの傾聴行動がより自然なものとなった.さらに,システム行動決定の際の注意点について,フェーズに依存しない一般的なものに加えて,フェーズごとに詳細な点を与えることで,細かな不自然さや違和感を軽減した.実際のプロンプトと対話例を示しながら,本設計の有効性を議論する.
抄録全体を表示
-
沼田 晃士朗, 小川 優介, 平川 巧人, 亀山 京右, 山本 賢太, 駒谷 和範
原稿種別: 研究会資料
p.
19-23
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本稿では,第7回対話システムコンペティションのシチュエーショントラックで設計したシステムのプロンプトについて説明する.対話の状況に関する情報のみのプロンプトでは表層的な会話に留まり,具体的な相談がなされないという問題がある.これに対し,友達との関係を維持するか縁を切るかというユーザの関係継続意思を明確化する質問を投げかけ,具体的なエピソードを引き出しながら共感を示すようにプロンプトを設計した.また,相談として理想的な流れを確立するため,指定されたシチュエーションを再現した人対人の対話例をプロンプトに挿入した.さらに,対話例の発話ごとにエージェントの声のスタイル,感情,動きを指示することでシステム発話と一貫性のあるマルチモーダルな振る舞いを実現した.
抄録全体を表示
-
鈴木 順大, イ ジョンフン, 大澤 静也, 前田 英作
原稿種別: 研究会資料
p.
24-28
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本論文では,対話システムライブコンペティション7のシチュエーショントラック向けに開発した対話システムについて説明する.本システムでは,対話相手の愚痴を相手の立場になって聴き,考え,ユーザの決断を後押しすることを目指した.そこで,発話応答・動作・感情を制御するLLMのプロンプトに,対話相手の視点に立った記述を加えた.また,システム側の不用意な割り込みを避けるため,発話者の発話語尾の種類によってシステム行動を変化させることを試みた.これにより,共感的対話を実現するための工夫として,一定の効果が観察された.しかしながら,システム全体としては,タスク制御が意図通りに動作せず,実装上の課題も明らかになった.
抄録全体を表示
-
松岡 広樹, 藤田 茂久, 堀口 篤志, 森 一生, 高久 咲知, 大野 瞬
原稿種別: 研究会資料
p.
29-33
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
認知行動療法で広く用いられるコラム法は、特定の出来事に対する思考や感情を記述し、そこに含まれる認知の歪みを理解したうえで、より現実的な思考へ導く手法である。特に、人間関係における困難な状況への活用が期待されている。本研究では、障害福祉サービス施設の利用者がコラム法を取り入れたマルチモーダル対話システムを開発し、ライブコンペ7のシチュエーショントラック予選会に出場した。本システムでは、生成AIであるGPT-4oを用いてユーザーの相談内容を解析し、コラム法に沿った質問を自動的に提示するよう設計している。さらに、ユーザーの回答から認知の歪みにつながる可能性を検討し、対話者の意思決定を支援することを目指している。予選会では14チーム中7位という評価を得た。
抄録全体を表示
-
森 大河
原稿種別: 研究会資料
p.
34-39
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本論文では,会話分析における成員カテゴリー装置の概念に基づいて設計された我々のシステムについて述べる.相談という活動は,「助言者」と「相談者」という二つのカテゴリーを担い手によって行われる.多くの場合,助言者は専門家であり,相談者は非専門家であるため,両者の知識の非対称性が助言者を助言者,相談者を相談者たらしめる.しかし,一般的な話題に関する相談では,必ずしも参加者間に知識の差があるとは限らない.そこで提案システムは,問題のある友人への対処経験を語ることで「問題を経験した者」と「現在問題を経験している者」というカテゴリーを参照し,非対称な関係を成させることで,助言を行う.
抄録全体を表示
-
長尾 萌, 寺尾 光一郎, 大賀 勇陽, 岩橋 直人, 佐々木 裕多, 小尾 賢生, 船越 孝太郎
原稿種別: 研究会資料
p.
40-45
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本稿では,第7回対話システムライブコンペティションの競技種目の一つであるシチュエーショントラックに出場した著者らのチームTabiTocが開発したマルチモーダル相談アバターシステム (TabiToc-CAS: TabiToc Counseling Avatar with Shared Belief Narratives)の概要と予選(1位通過)における評価結果を報告する.
抄録全体を表示
-
小堀 聡太, 花川 主税, 伊藤 雪, 藤江 真也
原稿種別: 研究会資料
p.
46-49
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
複数評価指標による状態管理と発話完了度予測による発話権管理に基づく手法を提案する.対話管理を条件確認フェーズと観光地説明フェーズに分離し,各フェーズで異なる評価指標による制御を実現する.条件確認フェーズでは,検索条件の明確さを示す条件曖昧性,要望の具体化しやすさを表す具体化困難性,観光地検索の実行可能性を示す検索条件充足度を用いてユーザの要望を段階的に具体化する.観光地説明フェーズでは,提案に対する否定的反応の強さを示す拒絶度,質問の有無を判定する質問判定,周辺施設情報の必要性を判断する周辺検索必要性を動的に評価しながら,中心観光地の説明と周辺施設の提案を行う.また,発話権制御にはユーザの発話完了度と文脈を考慮した予測を採用し,文末表現や発話内容に基づく適切なタイミングでの応答を実現する.これらの工夫により,ユーザとの自然な対話の流れを維持しながら,効果的な観光地提案を実現する.
抄録全体を表示
-
亀山 京右, 深澤 俊介, 山本 賢太, 駒谷 和範
原稿種別: 研究会資料
p.
50-55
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本稿では,対話システムライブコンペティション7のタスクトラック用に作成したシステムについて説明する.タスク指向型対話システムにおいて,LLM単独の対話管理ではタスクの達成が保証されない問題がある.作成したシステムでは,DialBBによるルールベースの対話管理とLLMによる発話生成を併用することで,柔軟な会話をしつつも確実に観光地を決定できる対話制御を可能とした.また,ユーザ発話中にシステムによる不要な割り込みが発生したため,Remdis組込みのVAPではなく別のVADを利用した.これらにより,柔軟な対話をしつつ観光地決定タスクを遂行できる対話システムを実装した.予選では,タスクを達成できた場合にユーザから高い評価を得ることができた.
抄録全体を表示
-
木俣 望, オウ シュウケツ, 富田 佳紀, 畠山 陽喜, 前田 英作
原稿種別: 研究会資料
p.
56-61
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本システムは,要約・状態遷移・検索の3つのモジュールで構成される.要約モジュールでは,LLM を利用して過去の対話内容を要約し,次の応答生成に必要なテキストを提供する.これにより,対話システムにおける LLM は過去の発話履歴をより包括的に把握でき,一貫性の高い応答が期待できる.状態遷移モジュールでは,LLM に要約を参照させることで,フェーズごとの目的が達成されたかを判断し,必要に応じて次のフェーズへ遷移する.各フェーズでは適切なプロンプトを用いることで,段階的かつ目的に応じた応答生成が可能となる.検索モジュールは観光地提案を行う際に起動し,要約情報をもとにユーザ嗜好を推定して,ユーザ嗜好に沿った観光地を検索・提案する.このように,3つのモジュールが連携することで,対話の一貫性を保ちつつ,ユーザニーズに合わせた観光地提案を実現する.
抄録全体を表示
-
三山 有, 岡田 将吾
原稿種別: 研究会資料
p.
62-67
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本システムは,ユーザの目的に適した旅行先の選定できるよう,多様な観光地候補を提案する対話システムを開発した.対話フローの管理には状態遷移ネットワークを用い,動的にプロンプトを生成・付与することで話題の制御を行った.候補観光地の抽出には「るるぶDATA」を活用し,観光地データで教師ありファインチューニング(SFT)を施したGPT-4oを用いて,Chain-of-Thought手法による候補選定を実施した.さらに,Travel Viewerを用いて観光地や周辺スポットの画像(標準45枚)を画面に表示することで,観光地の魅力をユーザに伝達できる仕組みを導入した.また、本稿では対話システムライブコンペティション7予選におけるユーザ評価を分析し、最適な旅行案内ボットの設計について考察する。
抄録全体を表示
-
麻田 千尋, 大貫 未佳, 後藤 悠斗, 能勢 将樹
原稿種別: 研究会資料
p.
68-73
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本稿では,タスクトラックの課題達成を目的に開発した,検索拡張生成を活用する表情豊かな音声対話システムの概要とその評価結果について述べる.本システムでは,対話状態ごとのタスク評価の結果を用いて,次の対話状態を決定し,各状態に紐づく応答方針を適用することで,対話戦略に基づきながら柔軟な話題に対応できる応答制御を実現した.また,検索拡張生成を活用し,根拠ある応答と関連情報(写真,地図,テキスト)を提示することで提案の信頼性を補強した.さらに,対話状態に応じた表情やジェスチャー,バックチャンネルを活用し,人らしい表現力を備えたバーチャルエージェントを実現した.予選では,本システムは参加者から高い評価を受け,特に,情報提供の質と量,信頼性,対応の好ましさで高評価を得た.
抄録全体を表示
-
大賀 勇陽, 寺尾 光一郎, 長尾 萌, 岩橋 直人, 佐々木 裕多, 小尾 賢生, 船越 孝太郎
原稿種別: 研究会資料
p.
74-79
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本稿では,第7回対話システムライブコンペティションの競技種目の一つであるタスクトラックに出場した著者らのチーム TabiToc が開発したマルチモーダル旅行プランニング対話アシスタントシステム TabiToc-TriPa: TabiToc Trip Planning Assistant)の概要と,予選における評価結果について報告する.
抄録全体を表示
-
王 棟
原稿種別: 研究会資料
p.
80-85
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究では、大規模言語モデル(LLM)の言語教育への応用可能性に着目し、文法項目と実例の適合性を識別する能力を評価する実験を実施した。具体的には、中国語教育文法を対象とし、まず教育文法シラバスに基づいて、文法項目とそれに対応する例文を含むデータベースを構築した。次に、異なる下位分類に属する例文を組み合わせ、高難易度のテストセットを作成した。その後、「文法項目と例文の適合性」に関する二項分類タスクを設定し、複数のLLMの識別能力を検証した。本研究の成果は、LLMの外国語教育能力を評価するベンチマークの構築に寄与するだけでなく、今後のLLMのさらなる最適化にも示唆を与えることが期待される。
抄録全体を表示
-
中村 佳登, メフムード ファイサル, サクリアニ サクティ
原稿種別: 研究会資料
p.
86-91
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
会話型ロボットの使用とその研究は、社会のあらゆる場所で増加している。また近年のロボットは複数言語を話す能力を持ち、多様な人々と交流できる。しかし、ロボットが使用する第二言語が完全に理解されない場合、無視されている、拒絶されている、排除されていると感じることがあり、これを「排斥」と呼ぶ。この現象は以前に多言語およびコードスイッチングの文脈で調査されたが、特に人間とロボットの相互作用においては探求されていない。したがって、ロボットのコードスイッチング発話がユーザーに与える心理的影響を調査することが重要である。この研究では、会話型ロボットによる日英CSがユーザーの排斥と包含感覚にどのように影響するかを調査し、さらにそれらが及ぼす影響に男女差があることも分析した。この研究により、より効果的で包括的な人間とロボットの相互作用システムの設計に貢献したいと考えている。
抄録全体を表示
-
田中 杏樹, 駒崎 俊剛
原稿種別: 研究会資料
p.
92-95
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究では、ロボットの発話の失敗が、人間のロボットへの受容度の変化にどのような影響を与えるのかについて検討する。ロボットと人間の会話の中でも、産業ロボットとは異なる特定のタスク遂行を目指していない、雑談をするロボットと人間との会話を分析対象とする。ここでも用いたロボットはM5Stackと音声合成サーバーと音声認識サーバー、Chat-GPTを組み合わせたものである。実験の方法は、ロボットとの会話の前にロボットへの受容度を質問紙調査により計測する。続いて、ロボット起点の会話を15分程度の行う。この会話の途中でロボットの聞き間違いを発生させる。会話終了後、ロボットへの受容度を質問紙調査により計測する。質問紙調査による受容度の変化と、ロボットの会話中の間違いを修復する過程で人間がロボットに対してどのような行為を行うのか、主に、発話と視線、顔の向きに焦点をあてた相互行為分析の結果を統合して検討する。
抄録全体を表示
-
木澤 妃名子, 有本 泰子
原稿種別: 研究会資料
p.
96-101
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
笑いの伝染性が共起笑いの音響特性に与える影響を明らかにするため,共起笑いの誘発要因と時間的要因の違いによる笑い声の音響的傾向を分析した.笑い合う場面で後発した笑いが対話相手の笑い声に誘発されたのかその他の要因に誘発されたのか笑い声とその他の要因の両方に誘発されたのかによって,共起笑いを3つに分類した.音響分析には,5つの音響的特徴量を使用した.誘発要因によって共起笑いの音響的特徴量に差があるか検証するため,各特徴量に対して共起笑いの誘発要因と時間的要因の2要因を用いた二元配置分散分析を実施した.その結果,笑いの伝染性による共起笑いは最大強度が小さく,継続時間長が短いことが分かった.また,笑いの伝染性による後発笑いの方が先発笑いよりも継続時間長が短いことが分かった.笑いの伝染性による共起笑い時,お互いの話者は小さい声で笑い合い,笑いが伝染した話者の方が短い声で笑う可能性が示唆された.
抄録全体を表示
-
黛 大誠, 有本 泰子
原稿種別: 研究会資料
p.
102-107
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究では,先行発話に続く笑い声の出現頻度と音響的特徴を先行発話の対話行為ごとに分析し,どのような行為の後にどのような音響特性を持つ笑い声が出現するかを明らかにする.これにより対話中の笑い声を発生させるタイミングを同定し,対話の流れに適切な音響特性を持つ笑い声を生成することを目指す.笑い声は,先行発話の話者が笑う話し手条件と,異なる話者が笑う聞き手条件に分類した.カイ二乗検定を用いて笑い声が後続する発話と後続しない発話の対話行為の出現頻度を分析した結果,先行発話の話者が笑う場合の対話行為は情報提供またはフィードバック反復が多いことが分かった.また,笑い声の音響的特徴量を抽出し,話し手/聞き手条件と4分類の対話行為を要因とした二元配置分散分析を行った結果,先行発話の対話行為が社会的付き合い管理系であるとjitterの低い笑い声が発声されることが分かった.
抄録全体を表示
-
阪上 芽以
原稿種別: 研究会資料
p.
108-113
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究は、日本語会話における「は?」という短い反応表現が多様な相互行為上の働きを担うことを、会話分析の手法を用いて明らかにした。分析から、「は?」は「意味不明さ」を主張することで、以下の三つの異なる相互行為を達成することが示された。第一に、先行発話の理解が困難な場面で「は?」を用いることで、発話者に説明や言い換えを促す修復開始としての働き。第二に、相手の立場や評価に対して「は?」を用いることで、「受け入れがたい」という挑戦的なスタンスを示し、対立を際立たせる働き。第三に、語りの展開において「受け入れがたい」内容に対して「は?」を用いることで、語り手の立場に共感を示し、物語の進行を支援する協調的な働き。これらの知見は、一見個人的な感情表出に見える「は?」が、実際には会話参加者間の理解や立場の調整を行う戦略的な相互行為資源として利用されていることを示唆している。
抄録全体を表示
-
臼田 泰如, 渡邉 新
原稿種別: 研究会資料
p.
114-120
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究では,対面会話とオンライン会話において,参与者の視線の配布がどのように異なるかという問題について,配布位置および配布のタイミングという観点から分析を行う.これまで,視線は会話における順番交代において重要な役割を果たすことが知られているほか,参与者の注意や関与を示すものとしても注目されてきた.他方,近年急激に身近なものとなったオンライン会話においては,視線の情報が対面会話とは異なった仕方で利用されている可能性が指摘されてきている.こうしたことを踏まえ,本研究では,同じ参与者のペアで両条件における会話を収録し,それぞれの注視位置および注視時間について集計した.分析の結果,注視位置については大きな違いが見られなかったが,順番交代における注視開始については違いがあることがわかった.このことが対面会話とオンライン会話における発話連鎖の違いに関係している可能性が示唆された.
抄録全体を表示
-
後藤 弘光, 渡邉 はるか, 枝元 香菜子, 白松 俊, 多田 孝志
原稿種別: 研究会資料
p.
121-126
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
令和の日本型学校教育の構築に向けて,「個別最適な学び」と「協働的な学び」を一体的に充実した主体的・対話的で深い学びの実現が望まれている.対話型授業における主体的・対話的で深い学びの要件は,教育実践研究としての理解が深められてきた.本研究は,実証研究の観点から,対話型授業における話し合い活動の設計の改善につながる知見を得ることを試みる.本研究では,対話型授業における児童・生徒の発話量などの発話特徴を,対面の話し合い見える化サービスを用いて収集する.また,Big-five特性やレジリエンス要因などのパーソナリティ特性を調査することで,対話型授業を実践する教師の班編成の傾向や,児童・生徒の実際の発話特徴とパーソナリティ特性の関係性を評価する.本稿では,小学校2クラス,中学校1クラスに対する予備的実験による結果を報告する.
抄録全体を表示
-
小野 仁士, 倉本 到
原稿種別: 研究会資料
p.
127-132
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究は,大規模言語モデル(LLM)を音声対話システムに組み込むにあたって課題となる応答速度の改善を目的としている.音声入出力による対話システムでは,音声認識技術を利用してユーザの完全な発話テキストを取得したタイミングで初めてLLMによる応答文の生成を開始できる.そのため,システムがユーザへ応答するまでに遅延が発生する.そこで本研究では,ユーザの発話終了を待たずに発話テキストを取得しそれに対する応答文を生成することで,対話システムの応答を早めることを考える.この手法では発話の末尾が欠けた入力文に対する応答文の生成を行うため,発話文を取得できている割合によって応答文の内容の変化が予想される.そこで,発話入力文の末尾の欠損率に対するLLMによる応答文の適切性を評価した結果を示す.
抄録全体を表示
-
中野 幹生, 駒谷 和範
原稿種別: 研究会資料
p.
133-138
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本稿では、ノーコード対話システム構築ツールDialBB-NCの設計と実装について述べる。対話システム技術を様々な分野に応用するためには、情報系の技術者ではなくても対話システムを構築できることが望まれる。DialBB-NCは、ノーコードで対話システムを構築するためのツールであり、インストール、コンフィギュレーション、対話知識の編集、アプリケーションの起動が容易にできる。対話知識は状態遷移ネットワークと大規模言語モデルの呼び出しを組み合わせて記述できる。DialBB-NCは、対話システム構築フレームワークDialBBを用いて実装されており、DialBBと同じくオープンソースとして公開されている。
抄録全体を表示
-
野々村 凌大, 森 大毅
原稿種別: 研究会資料
p.
139-144
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
大規模言語モデル(LLMs)を用いたマルチエージェントシステムは、人間のような自然な対話の実現に課題を抱えている。従来のシステムはテキストベースの単純なターンテイキングモデルに依存し、人間の会話に不可欠な社会的相互作用の繊細さを十分に再現できていない。本研究は、この課題に対し、会話分析研究で発見された話者交代の原理を応用した「Murder Mystery Agents(MMAgents)」フレームワークを提案する。隣接ペアとターンテイキングに基づく話者選択メカニズムと、エージェントの内部状態を考慮した自己選択手法を導入し、マーダーミステリーゲームを通じて対話の一貫性と推論能力を大幅に改善した。実験結果は対話破綻の減少と情報共有の向上を示し、人間の会話規範を取り入れたマルチエージェント対話システムの新たな設計指針を提供する。
抄録全体を表示
-
阿部 春香
原稿種別: 研究会資料
p.
145-150
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究は、宮城方言において同調表現とされていた「だから」を会話分析的手法によって分析し、厳密には「承認」という行為であることを示す。宮城方言「だから」は先行研究において、相手の発話に同意や共感、共通認識であることを示すものとされ、方言話者にとっては「強い同意」として使用されているとされてきた(東北大学方言研究センター, 2013; 真山, 2012;甲田, 2019) 。いずれの先行研究も大変示唆的である一方、なぜ「強い同意・共感」となり得るのかその客観的事実を示すことができていなかった。本研究は分析を踏まえ、宮城方言「だから」の基本的連鎖を示している。さらに宮城方言「だから」の特徴として、会話参加者の認識的・感情的・評価的スタンスのいずれかが一致した直後に宮城方言「だから」が産出されること、宮城方言「だから」の直前の発話が理解候補の提示としてデザインされていることを明らかにしている。
抄録全体を表示
-
加藤 恵梨
原稿種別: 研究会資料
p.
151-154
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
日常会話でほめことばとして使用される語に「すてき」と「すばらしい」がある。本研究では,『日本語日常会話コーパス』を調査資料とし,「すてき」と「すばらしい」が日常会話でどのように使われているのかを調査・分析した。その結果,「すてき」と「すばらしい」の違いについて,「すてき」のほうが「すばらしい」よりも女性の使用率が高いことがわかった。また,「すてき」はある事物について,その見た目が好ましいさまを表す場合に多く使われているのに対し,「すばらしい」はある人について,その言動が優れており,そのことを話し手が高く評価するさまを表す場合に多く使われていることなどがわかった。
抄録全体を表示
-
國分 彩華, 榎本 美香
原稿種別: 研究会資料
p.
155-159
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究では、話し手のターン構成単位中に開始された妨害的な重複発話の後、発話権を保持するのが誰になるのかを分析する。千葉大学3人コーパス(女性3人と男性3人の会話の2組(計20分程度)を分析資料として用いる。分析の結果、以下の4パターンが見られた。(1)妨害された発話者が発話継続するとその発話者が発話権を維持する。(2)妨害された発話者が発話を中断すると、妨害した発話者へ発話権が移行する。(3)妨害された発話者が発話継続しても、第三者が妨害した発話に反応すると、妨害した発話者へ発話権が移行する。(4)妨害された発話者と妨害した発話者が共に発話継続すると、妨害された発話者が妨害した発話者に反応し、妨害した発話者が妨害された発話者に反応することで、二つの発話権がパラレルに走ることがある。
抄録全体を表示
-
棟方 千咲, 榎本 美香
原稿種別: 研究会資料
p.
160-164
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究では、多人数会話における話し手の視線の宛先に応じた聞き手の笑いのいくつかの機能を明らかにする。千葉大学3人会話コーパス(女性3人の1会話約10分)を分析資料として用いる。分析の結果、以下の事例が見られた。(1)複数の聞き手が一斉に笑う場合は、話し手の視線の視線に関係なく、面白い発話が起こった時である。(2)話し手の視線が1人に向けられており、その聞き手だけが笑うのは、愛想笑い・共感・承諾の3種類がある。(3)話し手の視線が1人に向けられており、その聞き手ではない聞き手が笑うのは、愛想笑いである。聞き手の内の片方しか笑わない場合は、話し手への配慮がなされている時であると言える。
抄録全体を表示
-
田中 杏実, 榎本 美香
原稿種別: 研究会資料
p.
165-170
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究では、隣接ペアにおける、発話者、次話者、及び対象外の人それぞれの動作の特徴を「視線」「ジェスチャー」「ポスチャー」「自己接触」「頷き」の5つのポイントから明らかにする。日常会話コーパス(女性3人の会話1組(約8分)を分析資料として用いる。分析の結果以下の3者の特徴が明らかになった。(1)第1部分の発話者は、特定の一人(第2部分をすることになる聞き手)へ視線を向け手や指を差すといったジェスチャーが見られる。前傾姿勢も見られる。自己接触は第1部分開始前から発生する。発話末で頷く。(2)第2部分の発話者は、第1部分を行った聞き手へ視線を向けることが多い。承認の意味の頷きや不承認の意味の首振り・手の振りを行う。自己接触は抑制される。(3)それら以外の聞き手は、話し手へ視線を向けたり頷いたりしている。また、自己接触も見られる。ジェスチャーやポスチャーの動作は見られない。
抄録全体を表示
-
加藤 利梓, 井上 昂治, 河原 達也
原稿種別: 研究会資料
p.
171-176
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
人間どうしの対話において、頷き・視線・表情などの非言語情報は言語情報同様に重要な役割を担っており、近年研究が進んでいる音声対話システムにおいても、これらの非言語情報を適切に表出することが求められている。本研究では、非言語的聞き手反応の中で頷きに焦点を当て、それらのタイミングと種類をリアルタイムに予測するモデルを提案する。傾聴対話データに対して追加的に聞き手ジェスチャーを収録し、頷きを3種類に分類、アノテーションした。提案モデルとして話し手と聞き手の音声両方を用いるVAPをベースとしたモデルを紹介する。実験では相槌とのマルチタスク学習および汎用的な対話データを用いた事前学習を実施し、その有効性を確認した。提案モデルはリアルタイムアバター傾聴対話システムへ統合することができる。
抄録全体を表示
-
竹内 一央, 井上 昂治, 河原 達也
原稿種別: 研究会資料
p.
177-182
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
対話システムにおいて感情の表現は重要であり、「驚き反応」もその一つである。対話における驚きの要因はさまざまであり、予想外の展開や事物の希少性など知識や状況に依存する。対話システムのベースとなるLLMがこれらの要因を考慮して、驚き反応を示すことができるのかを評価した例は少ない。本研究では、(1)LLMでFew-shotで直接予測する方法、(2)軽量なBERTモデルを対話データでファインチューニングする方法、(3)LLMで対話の続きを予測し、実際の発話との差異に基づき判定する方法の3つを評価した。実験の結果、LLMをそのまま用いる方法が最も良いことが確認された。また、GPTの判断理由を精査したところ、驚く場面でも「一般的でよくあることである」という理由から誤って驚き反応を示さない判断を行う例がいくつか見られ、驚き反応を生成することの難しさや改善の方向性を明らかにした。
抄録全体を表示
-
福重 茜, 井上 昂治, 河原 達也, 山下 紗苗, 東中 竜一郎
原稿種別: 研究会資料
p.
183-188
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
近年、多人数対話の研究が重要性を増している。しかし、既存のほとんどの研究は二者間での対話を前提とするものが多く、多人数での対話の研究についてはあまり進んでいない。その中で、対話の中で人間関係を把握するということが課題の一つとなっている。対話に参加している者同士の関係性の把握が可能になれば、それに対しての掘り下げ質問を行なうことや、関係性が浅い人物のペアがいればそのペアに重点的に話題を提供することができるようになると考える。本研究では、多人数でのチャット対話を題材とし、対話の参加者のうち家族や友人といった関係性があるペアを推定することを目的とする。提案モデルでは、入力されたチャット対話から発話の回数や敬語の使用頻度などといった特徴を抜き出し、関係性を推定する。評価実験の結果、提案システムにより ChatGPT での推定を上回る関係性推定が実現された。
抄録全体を表示
-
井上 昂治, Lala Divesh, Elmers Mikey, 越智 景子, 河原 達也
原稿種別: 研究会資料
p.
189-194
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
音声対話システムの次なる研究対象として多人数対話への対応が挙げられる。そこでは、一対一の対話と比べてインタラクションが複雑になり、いくつかの新たなタスクを解決する必要が生じる。本研究では、その中でも特に重要な受話者推定に焦点を当てる。我々はこれまでに、3人による対面対話・議論を対象とした「鼎談コーパス」の収集を進めてきた。本研究ではまず、このコーパスに対して、ターンおよび受話者のアノテーションを行った。その結果、ターンの約2割において受話者が明示的に示されていることがわかった。次に、受話者推定の難易度を評価するため、大規模言語モデル(LLM: GPT-4o)を用いて受話者推定の精度を検証した。その結果、チャンスレベルを僅かに上回るのみであり、LLMが多人数対話の複雑さを十分に理解するには至っていないことが示唆された。
抄録全体を表示
-
坂井田 瑠衣, 井上 昂治, 坂尾 結衣, 中林 由希子, 横森 大輔, 高梨 克也
原稿種別: 研究会資料
p.
195-200
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
我々は,音声会話における身振りの意味が理解される過程について,簡便かつ汎用的にアノテーションを付与することのできる枠組みの構築をめざしている.その足がかりとして,日本科学未来館における科学コミュニケーターと来館者の対話を収録したマルチモーダルコーパス(未来館SCコーパス)の移動場面に対して,動作連鎖アノテーションを施すことを試みている.科学コミュニケーター(SC)が何らかの動作・発話によって来館者(V)に移動を促し,Vがそれに追従して移動を始めている連鎖について,その連鎖を構成しているSCの第1行為とVの第2行為をアノテーションしている.SCの第1行為の構成要素については,歩行,指さし,志向変化,発話,身振りのいずれが使われているかをアノテーションしている.本発表では,開発中の動作連鎖アノテーションの趣旨や概要と,付与されたアノテーションをもとにした簡易的な分析結果について紹介する.
抄録全体を表示
-
岡﨑 一樹, 遠藤 裕一朗, 倉本 到
原稿種別: 研究会資料
p.
201-207
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
対話ロボットとの継続的なコミュニケーションを行うためには,ロボットと利用者との間 に信頼関係が存在することが望ましい.しかし、ロボットとの対話における信頼関係は簡単には構築・醸成できない.そこで本研究では大規模言語モデルを用いた対話機能を有するロボットを異なる年代層の利用者と対話させ,信頼関係を構築する基盤の一つである対話の自然さを評価した.実際にロボットと若者および高齢者と対話させる実験の結果,ロボットとの対話の自然さの捉え方には,若者と高齢者との間に違いがないことが分かった.一方で高齢者の方が若者に比べてロボットに対してポジティブな印象を持っている可能性も示された.
抄録全体を表示
-
田頭 未希
原稿種別: 研究会資料
p.
208-213
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究は、日本手話話者による非手指要素の同時入れ替わり現象と発話の韻律境界との関係を明らかにすることを試みる。まず、名詞句において複数の非手指要素が同時に入れ替わる現象(田頭2021, 2022, 2023)が、モノローグ発話でも見られるのかを分析した。その結果、非手指要素の同時入れ替わり現象は短い発話だけでなく、長めのモノローグ発話にも適用されることが確認された。さらに、要素の同時入れ替わりの際に、入れ替わる要素の数は2から3要素が最も多いことが明らかになった。次に、予測として、非手指要素の同時入れ替わり現象が生じる可能性のある場所についての一般化を試みた。
抄録全体を表示
-
久保田 なつみ, サクティ サクリアニ
原稿種別: 研究会資料
p.
214-217
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
Stuttered speech presents significant challenges for automatic speech recognition (ASR) due to its irregular patterns and the scarcity of annotated data. This limitation hinders the development of robust systems capable of accurately recognizing and processing stuttered speech. To address these issues, this study propose a novel approach that leverages text-to-speech (TTS) technology for data augmentation, enabling the synthesis of realistic stuttered speech to supplement existing datasets. Using this augmented data, this study develop an ASR system within a speech translation framework designed to transform stuttered speech into fluent text.
抄録全体を表示
-
北原 彩乃, 細馬 宏通
原稿種別: 研究会資料
p.
218-221
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
ろう者と聴者とがタップダンスを行うとき、どのような方法で身体動作の同期を達成しうるだろうか。本研究では、聴視者が講師となり、ろう者、視覚障害者および聴視者の生徒とタップダンスナンバーの練習をする場面を観察記録した。この練習では、講師は、ろう者、視覚障害者、聴視者の全員に対して同期に必要な視聴覚的手がかりを出す必要がある。この手がかりにどのような時空間構造があるときに同期が達成されるかについて、26例をELANによって分析した。その結果、講師は、手拍子などの聴覚的な手がかりを発する動作の直前に、複数の拍にまたがる予備動作(大きな振り上げなど)を行ったり、起点のはっきりした動作(組んだ手をすばやく離すなど)を行うことで、聴覚的のみならず視覚的に正確なキューを生み出していることがわかった。また、こうした動作は、何度かの試行錯誤の末にその場で編み出されていくこともわかった。
抄録全体を表示
-
大森 幹真
原稿種別: 研究会資料
p.
222
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
-
河野 真有香, 平尾 悠太朗, ペルスキアエルナンデス モニカ, 内山 英昭, 上垣外 英剛, 清川 清
原稿種別: 研究会資料
p.
223-227
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
ASDの小児の言語や事物の認識を理解することは,彼らに対する支援の適切性の評価に重要である.しかし,周囲の者がこれらを理解することは容易ではない.これに対して従来,ASDの視覚特性などを再現し,理解を促すことを目指した研究が行われてきたが,個人差の大きなASDの特性の再現には不十分である.そこで,我々はASDの小児の言語認知メカニズムの解明および新たな支援方法の開発への寄与を目的に,(1) LLMによるASDの小児の多様なペルソナの作成,(2) 作成したペルソナを与えたASDKidsPersonaLLMの確立を目指す.本稿では,LLMにASDの小児と定型発達の小児によるストーリーを識別する能力を引き出せるプロンプトと識別精度を調査し,結果と今後の展望を報告する.ASDの小児によるストーリーを解答するという5択QAタスクにより識別精度を確認した.
抄録全体を表示
-
謝花 匠, 坂間 千秋
原稿種別: 研究会資料
p.
228-233
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
感情や行動などをイラストと言葉で表した絵カードは,発達障害やコミュニケーションを苦手とする子どもを支援する目的で利用されている.近年,画像生成AIの普及により,イラストを自動生成する技術が発展してきたが,絵カードの作成は依然として人手に頼っている.また,作成されたイラストが意図する感情や意思を適切に表現できているかを客観的に判断する手法も確立されていない.本研究では,AIを活用した感情理解支援を目的とし,絵カードイラストが表す感情とコミュニケーションをLLMで推論およびファインチューニングによる言葉の推論精度向上を行い,生成された推論結果が正しいかどうかを評価する手法,ならびに絵カードイラストを用いて画像生成AI Stable Diffusionの追加学習を行い,感情を表現する絵カードイラストを自動生成する手法の2点を提案する.
抄録全体を表示
-
松本 敏治
原稿種別: 研究会資料
p.
234-238
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
松本は、青森県津軽地方の発達障害に関わる人々の間に存在する「自閉症児は津軽弁を話さない」との風聞をきっかけにASDの方言使用に関する研究を行ってきた。全国調査の結果は、ASDの人々の方言不使用という印象が全国でみられること、さらに方言語彙の使用も少ないことを示した。また、アイスランドおよびアラビア語圏など自然言語とメディアで優位な言語に乖離がある地域では、ASDの人々でメディア言語の優位な使用が見られるとの報告があり、メディアからの言語習得の可能性が指摘されている。一方、言語発達の先行研究は、言語習得における社会的相互作用の重要性を指摘しており、メディアからの言語習得については批判的な意見が強い。障害特性、社会の言語システム、さらにメディア機器・コンテンツの進化という側面から、方言主流社会、アイスランド、北アフリカでみられる現象と言語発達の先行研究を融合する解釈を提出する。
抄録全体を表示
-
越智 景子, 小磯 花絵, 幕内 充, 河原 達也
原稿種別: 研究会資料
p.
239-241
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
自閉スペクトラム症のある成人や子どものコミュニケーションの特徴は、話者交替時間や韻律的特徴について研究が行われている。その一方で、自閉スペクトラム症の特性の強弱は連続体であり、多かれ少なかれその特性を日常会話の中の参与者それぞれが有しているという考えに基づいて対話を分析した例は少ない。ここでは、日本語日常会話コーパスを題材とし、話者交替時間や相槌頻度について、自閉症の特性が比較的強い話者と特性が弱い話者を比較する。その結果、自閉症の特性が強い群のほうが話者交替時間が長く、相槌の頻度については、応答系および感情系相槌両方とも自閉症特性が強い群より弱い群のほうが頻繁であることが分かった。
抄録全体を表示
-
鈴木 璃土, 高畑 脩平, 寺山 慧, 黒田 嘉宏, 家永 直人
原稿種別: 研究会資料
p.
242-247
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
作業療法では感覚統合障害のスクリーニングとして、子どもの姿勢制御能力を評価する必要がある。しかし、作業療法士(OT)の主観的評価を定量的に評価することが難しいという課題がある。従来手法では、姿勢推定手法により得た肘や膝などの一部のキーポイント位置から、OTの主観的評価を回帰する手法が提案された。だが、トップダウンな指標が利用されたため、他のキーポイントにも重要な情報が含まれている可能性がある。そこで本研究ではGraph Convolutional Networkにより、姿勢推定手法で得られる全てのキーポイントを活用する手法を提案する。実験の結果、OTの評価とのスピアマンの相関係数は0.848となった。また、上半身よりも下半身が重要であることと、従来検討された膝やくるぶし以外にも、踵とつま先の関係も重要であることが示唆された。本研究成果は、今後の検査や指標の作成に貢献することが期待される。
抄録全体を表示
-
鈴木 あすみ, 幕内 充, 和田 真, 中村 仁洋, 石井 亨視, 小磯 花絵
原稿種別: 研究会資料
p.
248-253
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
自閉スペクトラム症 (ASD) 者と定型発達 (TD) 者の間では、両者のコミュニケーションスタイルの違いから語用論的な障害が生じ得る。本研究では、日本語母語話者のASD者を対象とする映像付きコーパスを構築し、国立国語研究所からの公開を目指す。ASD者/TD者各6名を対象に、1人当たり合計約110分の会話の映像・音声 (P-Fスタディ・コミュニケーションの困りごとインタビュー・自由会話) を収録した。現時点で形態素解析済みのASD者6名/TD者5名のP-Fスタディのデータに基づき、総発語数に占める間投助詞・終助詞の「ね」の使用率の差を検証したところ、ASD者 (平均1.44%) はTD者 (平均3.36%) に比べ「ね」の使用率が低かった (p = 0.004)。本研究で示された「ね」の使用率の低さは、ASDの診断における指標やサブグループ判別に有効な特徴量として活用できる可能性がある。
抄録全体を表示
-
井阪 建, 西條 涼平, 松尾 翔平, 戸嶋 巌樹, 澤瀬 順一
原稿種別: 研究会資料
p.
254-257
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
ASD傾向が高い人の多い職場では、ミスコミュニケーションが起こりやすく、職場内でのコミュニケーションの失敗経験に起因する離職率が高いという社会問題がある。とくに曖昧な言葉(曖昧語)に対しては、発話者の意図とは異なる誤った解釈をする可能性がASD傾向の強さに従って高まり、ミスコミュニケーションの主要因となっていることがわかっている。この問題を解決するため、我々はオンライン会議において発話された曖昧語を検知・通知し、明確な言葉への言い換えを発話者に促すツールを開発している。本ツールを高ASD傾向者が多く勤める職場に約2か月間導入し、通常業務におけるオンライン会議時に試用させた結果、発話される曖昧語の数が導入初期から徐々に減少していく傾向を観測した。参加者へのインタビューでも、「内容の具体化により手戻りが減った」といった報告があり、実際の職場への導入の有効性を確認した。
抄録全体を表示
-
牧野 遼作, 門田 圭祐, 山本 敦
原稿種別: 研究会資料
p.
258-261
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本発表は、発達障害児童が参与したトランポリン教室を対象としたビデオ行動観察を報告する。この教室には、ダウン症児童や自閉症児童といった発達障害児童が通っており、発達障害児4人と講師1人が参与していた。児童は1人ずつ跳び方の指導を受けており、その間、他の児童は待機している必要があった。教室の冒頭では、講師の呼び出しに基づいて、児童たちは跳ぶ順番を交替していた。活動が進むにつれ、児童たちは自発的に、跳ぶ順番を身体配置として具体化しながら待機するようになった。最終的に、講師が児童を逐一呼ばずとも活動が進むようになった。様々な相互行為は、参与者たちが何らかの順番を適切に交替することで円滑に進行する。本発表でみた指導も、跳ぶ順番を児童たちが具現化し、それを講師も理解することで、円滑に進んでいた。これは、相互行為の基盤となる順番交替を適切に達成するための能力を発達障害児が有していることを示唆している。
抄録全体を表示
-
鈴木 花恵, 南 泰浩, 小林 哲生, 阿久津 由紀子
原稿種別: 研究会資料
p.
262-267
発行日: 2025/03/06
公開日: 2025/03/06
会議録・要旨集
認証あり
本研究では、大規模幼児語彙データを基に幼児の語彙発達における個性の分析を試みる。幼児の語彙獲得傾向は発達段階を理解するうえで重要であり、これまでの研究ではロジスティック回帰分析により語彙獲得年齢の推定を行い、「共通ボキャブラリ指数」を提案してきた。その結果、地域差はほとんどなく、定型発達児・非定型発達児を問わず語彙数が同等の幼児は類似した単語を話す傾向が確認された。語彙発達の主因子は語彙数であり、個性や障害の影響は少ないとされるが、幼児のタイプを分析することには学習促進や心理学的意義がある。従来の研究では語彙数の差により単純な分類に留まっており、語彙発達過程における幼児のタイプ(個性)の分析を行った研究はこれまでに例がない。本研究では同程度の語彙数の幼児のデータを収集し、LDAによるトピック分類とSVMを用いた分析を行い、語彙発達の個性を明らかにすることを目指す。
抄録全体を表示