人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
最新号
選択された号の論文の41件中1~41を表示しています
  • 吉田 司, 新堀 和紀, 深山 篤
    原稿種別: 研究会資料
    p. 01-06
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では画像キャプション生成において、個人性を持つ説明文を生成することを目的とする。ここでの個人性には画像に対して注目する観点や、言い回しなどが含まれる。大規模言語モデルの発展に伴い、様々な言語タスクで優れた成果が得られている。文の生成のタスクにおいて個人性を再現しようとした場合、言語モデルを個人から得た学習データから調整することが考えられる。しかしながら個人からのデータの収集には限界があり、少量のデータしか得られないことがほとんどである。そこで本論文では文章生成におけるトークン生成順序の探索について着目し、この探索において少量のデータから学習した個人識別モデルとモンテカルロ木探索を用いることを提案する。実験では一般に用いられるビームサーチと比べて提案手法が幅広い文章を生成できることを示し、また個人性の再現において有益であるを示す。

  • 山本 賢太, 駒谷 和範
    原稿種別: 研究会資料
    p. 07-12
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    対話システムにおける発話の一貫性はユーザとの自然なインタラクションの実現のために重要な要素である.ユーザはシステムによる一貫性を持った発話に対して,システムの性格を感じ取ることが知られている.そのため発話の一貫性の実現においては, システムの性格を反映した発話生成が必要である .本研究では,大規模言語モデルGPT-4によりシステム発話にBigFive性格特性を反映させた発話生成の性能を評価した.発話生成の際に性格特性ごとに関連する形容詞群をプロンプトに指定することで,性格特性を反映した発話生成を実現する.評価実験では,この発話生成方法を用いたシステムと仮想ユーザとの対話例を作成し,被験者にシステムの性格について評価してもらった.実験結果から,発話生成の際に指定した性格特性と被験者による性格の評定点との間に相関があることが確認された.

  • 袁 培傑, 大野 正樹, 橋本 泰一
    原稿種別: 研究会資料
    p. 13-19
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    Large language models (LLMs), such as ChatGPT, have risen to prominence in text summarization tasks, primarily due to the advent of in-context learning. This paper delves into how in-context learning steers the outputs of LLMs based on different data demonstration configurations. Our pivotal findings reveal that ChatGPT's adaptability to target summarization tasks is enhanced when provided with paired text and summaries compared to when provided in isolation. Furthermore, the structured presentation of these pairs proves more influential than their precise content alignment. However, there are observable limitations: increasing the number of demonstrations yields diminishing returns, and the improvement of adaptability declines when tasked with more intricate news texts as opposed to simpler dialogues. This study comprehensively explains in-context learning's nuances in text summarization, highlighting its merits and demerits for future researchers.

  • 岩橋 直人, 寺尾 光一郎
    原稿種別: 研究会資料
    p. 20-23
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では、多数の大規模言語モデル(LLM)エージェント間の対話を通じて生じる集団全体の対話ダイナミクスを数理的に分析する。合意形成タスクを分析対象とした。既存の統計力学モデルを拡張し、対話現象の重要な側面(言語コミュニケーションの不確実性、信念状態の推論、記憶、相手の選択など)を取り入れた新しいマイクロマクロモデルを開発した。このモデルを用いて、エージェントの特性、ネットワークの構造などの要素が、エージェントの心的状態、共有される情報、対話内容の分布のダイナミクスにどのように影響するかを、統計力学、複雑ネットワーク理論、パーコレーション理論に基づく指標を用いて分析した。この分析により、言語コミュニケーションに基づく社会のダイナミクスを理解するための重要な洞察が得られた。

  • 熊野 史朗
    原稿種別: 研究会資料
    p. 24-26
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    対話をはじめとして人の感情や内面状態の推定を一つのマイルストンとする研究分野では、これまで様々な人が抱く主観の平均が主な対象となっていた。近年、パーソナライゼーションの研究が増加しているが、集団の平均を見るときにはあまり深刻でなかった問題に直面している。一つは、主観的判断自体の不確実性、すなわち、同じ人が同じ場面や対象に対して常に同じ評価をするわけではないということである。この不確定性を前提としてモデルを訓練し評価する必要がある。二つ目の問題は、個々人の反応バイアスである。多くの場合において我々が知りたいのは、対象人物が「どのように感じるか」である。だが、多くの研究は生の主観評価値をそのまま出力としており、これはその人物の認知後の「何を選ぶか」を予測していることを意味する。本発表では、これら2つの問題に対する我々の最近の研究を紹介する。

  • 岩立 直也, 有本 泰子
    原稿種別: 研究会資料
    p. 27-32
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では,3人会話において,次話者指定の有無を区別する話者交替予測モデルを構築する.人同士の会話では円滑に話者が交替するが,現状の音声対話システムは一定の沈黙を検出して応答を開始するため,ユーザと発話が衝突したり,応答が遅れるなど話者交替予測が不十分である.既存の研究では,聞き手が発話を行えるタイミングである話者移行適格場(TRP)の情報を使用し,話者交替の予測精度を向上させた.しかし,現話者が他者を選択して話者が交替したのか,自己の判断により交替したのかを区別できておらず,システムはユーザに不信感を与える可能性がある.従って,他者選択・自己選択による話者の交替と,TRP・非TRPでの話者継続の4クラスを区別する話者交替予測モデルを提案し,その有効性を検証した.実験結果は,4クラス予測は従来の話者交替予測よりも予測精度が低く,4クラス予測ではTRPの情報が有効であることが示唆された.

  • 川端 良子, 中野 幹生
    原稿種別: 研究会資料
    p. 33-38
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    会話では,眼前の事物に言及することもあれば,過去や未来の特定の場所で起こった(る)出来事,さらには実際には生じない架空の出来事に言及することがある。そして,その時間や場所は会話の途中で頻繁に移行する。そのため会話の参加者は,発話で言及される対象や出来事がどの時間・場所で生じたものであるかを推論する必要がある。これまで,過去に起こった出来事を語る言語表現についてはナラティブの研究があるが,現在,未来,架空の出来事も含め会話中の移行に関する研究は少ない。そこで本研究は,話し手が特定の出来事や対象に言及する際,その出来事が生じた時間や場所のことを「シーン」と呼び,過去・未来・仮定の時間の違い,眼前・眼前以外の場所の違いが実際の会話の中でどのように表現され,シーンの移行がどのように行われているのかを『日本語日常会話コーパス(CEJC)』を用いて調査し,その結果を報告する。

  • 木守 翔子, 岡本 雅史
    原稿種別: 研究会資料
    p. 39-46
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では、ラジオパーソナリティのエピソードトークに出現する非流暢性要素の特徴を明らかにするため、パーソナリティ歴との関連性に着目して分析した。具体的には、非流暢性要素を「フィラー」「自己修復(「中断」「言い直し」「繰り返し」)」「音韻の延伸」「無声休止」「呼気・吸気」の5つに分類し、熟達者と初心者の各トークにおける出現頻度を調査した。その結果、非流暢性要素全体の出現頻度は熟達者より初心者のトークで高く、「延伸」「フィラー」の出現数が大部分を占める一方、「自己修復」の出現頻度は熟達者のトークを下回っていた。また、フィラーの出現形式については、初心者のトークでは、特定のフィラーのみが偏って出現すること、フィラーが連続して出現することが明らかとなった。以上より、非流暢性要素をなるべく使用せず、特定の種類のフィラーに偏らせないことがラジオパーソナリティの情報伝達上の工夫であると考察できる。

  • 保土沢 朋和, 村井 源
    原稿種別: 研究会資料
    p. 47-52
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    チャットボットへのキャラクター性の付与を目的に,キャラクタービジネスで売り上げの多い『ウマ娘 プリティーダービー』を対象として,ゲーム内のセリフから,意図の分類と形態素解析を行った.分析手法として,使用する意図の残差分析,意図のbigram,意図ごとに使用する自称詞と対象詞の比較を行った.また,使用する意図の残差分析は一般女性との比較も行った.その結果,キャラクターと一般女性が使用する意図に大きな差異があることが明らかとなった.また,自発的で積極的な意図を使用する特徴,思考や同意をすることで落ち着いた発話をしている特徴,相手に相槌や同意をすることで相手に甘えるような特徴から自信家,お嬢様,弱気の属性のキャラクターらしさが計量的に明らかとなった.得られたキャラクターの特徴量をチャットボットのプロンプトとして利用することでキャラクターを想起させるチャットボットに活かすことができると考えられる.

  • 森下 空, 堀内 靖雄, 原 大介, 黒岩 眞吾
    原稿種別: 研究会資料
    p. 53-58
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    日本手話は自然言語であり、「位置」「動き」「手形」の3種類の音素を持つと考えられている。その中で「動き」の音素における直線運動に関して、左右上下前後の6方向の音素に関しては先行研究で検討を行ったが、斜め方向に関してはまだ未解明である。そこで本研究では日本手話単語の斜め方向の直線運動を分析した結果、その多くは図像性の高い単語に見られることが明らかとなった。また、左手などの体の部位に沿った運動ではその部位に関連する座標系を導入すると左右上下前後の6方向の音素で表現できる可能性が示唆された。

  • 田中 弥生, 小磯 花絵
    原稿種別: 研究会資料
    p. 59-64
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究は脱文脈化の観点からのコミュニケーション分析の一環である。本発表では、家族の食事場面における幼児の発話に焦点を当て、話題内容と脱文脈化度を検討した。現在国立国語研究所で構築中の『子ども版日本語日常会話コーパス』に収録予定の家庭での親子の談話について修辞機能と脱文脈化指数を特定したところ、話題の内容によって使用される修辞機能が異なることが改めて確認された。2歳児の発話には文にならない語句や、単語による要求が多く見られ、食事の話題では、父親と11歳の姉から話し方の指導が脱文脈化度の低い修辞機能によってなされていた。食事に直接関係のない話題において、2歳児は理解できる身体的な内容については家族から要求されなくても会話に参加する一方、理解できない話題では、家族が話しているのを見ていても会話に参加しなかった。また、7歳の兄は脱文脈度の高い発話を自ら複数回行っており、年齢差が明らかになった。

  • 加藤 恵梨
    原稿種別: 研究会資料
    p. 65-68
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究の目的は、前置きの呼びかけとして用いられる感動詞「あのね」の用法について、『日本語日常会話コーパス』(CEJC)をもとに明らかにすることである。先行研究では、「あのね」は「親しみをこめて呼びかける語」「(遠慮がちに)相手を説得する気持ちを表す」と説明されている。しかしCEJCをみると、それだけではなく、親しい間柄であっても少し改まって意見を言うときや、相手の意見を正すとき、また相手の説明に補足するときの前置き表現として使われている。さらに、「あのね」は「主に女性や子供が使う」と指摘されることがあるが、CEJCでは性別にかかわりなく使われていることなどを述べる。

  • 寺尾 光一郎, 岩橋 直人
    原稿種別: 研究会資料
    p. 69-73
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では、多数の大規模言語モデル(LLM)エージェントが参加する対話環境における、集団全体の対話ダイナミクスのミクロマクロリンクの多様性について論じる。分析対象とした対話タスクは、名付け、情報の伝達、一般的なチャット、そして討論などを含む。個々のエージェントの記憶容量、社会的価値の志向性、およびビッグファイブパーソナリティ特性が、意見分布、言語分布、情報の拡散、話題の分布などの集団レベルのダイナミクスにどのように影響を与えるかを探求した。その結果、ミクロマクロリンクに顕著な多様性が存在することが確認された。この研究は、言語コミュニケーションを基盤とした社会の形成や安定性について考えるための新しい視点を提供する。

  • 藤田 華奈, 坂井田 瑠衣
    原稿種別: 研究会資料
    p. 74-78
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    対面状況では醸し出される表出が主に身体を介して産出されるが,SNSではそれが行われない.しかし,SNSでは言語的な記述以外の印象を左右するような情報が,身体的表出に相当する何らかの手段によって伝達されている可能性が高い.そこで本研究は,Twitter上で活動している「絵描き」が異なるアカウントごとに印象管理をどのように行っているのかを,日常的なツイートの中から同じ主旨のツイートを抽出し,事例分析した.その結果,表アカウントでは特徴的なオノマトペやイラストで状況を表現するといった方法によって文章の粒度が低くなっており,絵文字や冗談によって深刻度が低くなっていた.一方で,裏アカウントでは時間軸に伴う変化を記述することや,状況を詳細に記述することといった方法によって文章の粒度が高くなっており,句点や正しい動詞を使用したり,身体性を言語化したりすることによって深刻度が高くなっていた.

  • 澤田 菜乃, 坂井田 瑠衣
    原稿種別: 研究会資料
    p. 79-84
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では,相互行為分析を用いて,会話中に生じる気まずい沈黙とは何か,人がその気まずさにどのように向き合っているかを明らかにした.まず,直感的に気まずいと感じられる沈黙とそうでない沈黙の発生方法を比較し,「次話者が選択されていないものの,自己選択で誰かが話し出してもいいはずの沈黙」を気まずい沈黙と定義した.また,会話への志向が参与者間で不均衡な場合に,沈黙が気まずいものとなることが明らかになった.次に,気まずい沈黙への向き合い方を分析した結果,(1)誰かが会話への志向を弱めながら発話する,(2)会話への志向がより強い参与者を中心とした参与枠組みに組み替える,(3)会話への志向が弱い参与者の志向を強めさせる,という3つの方法が使われていた.このように会話の参与者は,参与者間で生じた会話への志向の不均衡を解消しようとしたり前景化しないようにしたりすることによって,気まずい沈黙に対処していた.

  • 牧野 遼作, 菊地 浩平, 堀内 隆仁
    原稿種別: 研究会資料
    p. 85-89
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本稿では,会話分析で作成利用されるトランスクリプトの作成補助ツールであるtracrin2.0を紹介する.会話分析では,分析のためのトランスクリプトが重要な役割を果たす. こういったトランスクリプトを作成する際のルールは,様々な記号を駆使するかたちで整備されてきたが,人力による調整が必要とされてきた.例えば発言の重複開始位置などは,半角スペースなどを挿入し,記号の位置を調整することで表現されてきた.ELANは,重複の開始位置等をほとんど気にせずとも重複を視覚化することができるなど,転記作業の容易化に大きく貢献したと考えられる.一方で,論文化にあたっては依然としてトランスクリプトに落とし込む必要があり,課題が残っている.tracrin2.0では,ELANで作成した転記から,オーバーラップ記号などの位置を自動的に調整し,会話分析の論文などで利用可能なトランスクリプトに変換するものである.

  • 山本 敦, 牧野 遼作
    原稿種別: 研究会資料
    p. 90-94
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    「非典型的相互行為atypical interaction」とは、会話分析を主な分析手法としてコミュニケーション障害の相互行為的側面に着目した研究を行う比較的新しい学際的領域である。本発表では、非典型的相互行為者("障害を呈する"相互行為参与者)について従来の"能力が損なわれている不完全な典型者"という見方から、"限定された能力を駆使して相互行為状況に適応しようとする非典型者"、さらには"典型者とは異なる形の能力を持つ非典型者"という見方が提示されてきた流れを概観する。そのうえで、この流れを推し進め非典型者の"コミュニケーション能力の特有性"を分析していく際には、会話分析の手法には理論上の限界があるだけでなく、誤った知見を体系的に生み出してしまう危険がある可能性を指摘し、その問題の解決策についても論じたい。

  • 臼田 泰如
    原稿種別: 研究会資料
    p. 95-100
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    日常会話において,参与者が過去に経験した「嫌なこと」についての語り (complaint) において,しばしば語り手がその語りの登場人物の言動を笑うべきもの (laughable) として提示し,それについて受け手が笑うという事態が観察される.本研究では,連鎖上の位置およびターンの構成を分析し,laughableがどのようにcomplaintの語りに導入されているのかを明らかにする.分析の結果,以下のことが明らかになった.Laughableが導入されるターンは,その直前に長いポーズが置かれる,フッティングが変えられているなど,語りのそれまでの部分と切り離されて生じる.そのことにより,そのlaughableをcomplaintの他の部分と区別し,受け手が笑うことのできる位置を作り出していると考えられる.

  • 畠山 陽喜, 森脇 恵太, 酒造 正樹, 前田 英作
    原稿種別: 研究会資料
    p. 101-106
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    様々な言語処理タスクに対して大規模言語モデル(LLM)の活用が広まりつつあるが,大規模言語モデルには事実と整合しない情報を生成するというhallucinationの問題が指摘されている.これを解決するため,機械学習を利用してhallucinationの検出器,修正器を構築する方法が提案されているが,検出器による誤検出や修正器による過剰修正が発生し,十分な解決に至っていない.一方,hallucinationの検出,修正にLLMそのものを利用する方法も提案されているが,それらはmulti promptを利用したパイプライン処理をしているため,誤検出,過剰修正に対する本質的な解決策となっていない.そこで,本研究では,single prompt による事後修正手法を提案する.数字と固有名詞に関するhallucination に焦点を当て,既存手法との比較評価を行い,提案手法の有効性を確認した.

  • 永沼 翔翼, 石垣 龍馬, 酒造 正樹, 前田 英作
    原稿種別: 研究会資料
    p. 107-110
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    近年の推薦システムは,ユーザの嗜好を理解し,パーソナライズされた商品やサービスを提供する重要なツールである.しかし,一般に推薦システムは,新規ユーザやアイテムに対して限られた情報で推薦しなければならないというコールドスタート問題が存在する.この問題の解決を目指して,本研究では,大規模言語モデルを用いたユーザプロファイル拡張の有効性を検証する.大規模言語モデルが持つ広範な知識と高精度の特徴抽出機能により,拡張したユーザプロファイルを生成することで推薦精度の向上が期待できる.実験では,映画のデータセットであるMovieLensを用いて,年齢,性別,職業といったユーザプロファイルをそのまま推薦に利用する場合とGPT-4により拡張して利用する場合の推薦精度を比較した.実験の結果,拡張ユーザプロファイルを用いた場合,評価指標 MAPとNDCGの向上がそれぞれ0.02,0.01となることが示された.

  • 高山 春花
    原稿種別: 研究会資料
    p. 111-115
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究は、国立国語研究所で現在構築中の『子ども版日本語日常会話コーパス(仮)』 に格納予定である家庭内での幼児 (3名、1歳 7ヶ月~5歳 7 ヶ月時)と保護者またはきょうだいとの会話データを対象に、スピーチスタイルのアップシフトの相互行為的機能と発生環境を分析する。アップシフトは常体を基調とする会話が一時的に敬体に切り替わる現象である。本研究のデータではアップシフトは2歳頃からの家庭内会話に現れ始め、家庭内での遊びにおいて特定の社会役割を演じる際や、ルールや決まりごとについての説明、実演や宣言といった公的な発言の合図としての起こるという特徴が観察された。幼児のアップシフトを受け、保護者もまた敬体を用いて特定の社会役割を演じ始める、あるいは実演や宣言の状況設定に参加する形で反応をすることが多く、幼児のアップシフトが互行為ユニットへの切り替わりを合図する機能を果たしていることが示唆された。

  • 秦 大地
    原稿種別: 研究会資料
    p. 116-121
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本稿では発話における意図に焦点を当て、アイロニー伝達の複雑さを解きほぐそうと試みた。アイロニーは否定的評価の婉曲的な伝達であるがゆえに、その暗示と解釈において話し手と聞き手の推測は複雑に組み込まれる。この意図の入れ子構造は、従来のアイロニー論で見逃されていた観点であり、本稿はこの点のモデル化を行なう。この点に加え、以下の3つの観点も考慮に入れられる。・オーディエンス・デザイン:話し手は誰を聞き手として想定するかによって表現を変える・ダブル・オーディエンス:話し手の意図が伝わる相手とそうでない相手とを区別して考える必要がある・ターゲット:聞き手とターゲットは常に一致するとは限らない。これら諸観点の考慮から明らかなのは、話し手はアイロニーの発話に際し、誰に・どのように理解させるかを緻密に設計しているということである。つまり、アイロニーは視点によって見え方が変わる言語表現である。

  • 梁 勝奎, 岸本 健太
    原稿種別: 研究会資料
    p. 122-127
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では謝罪表現が持つとされる感謝の機能に注目する。これまでの研究では「すみません」が感謝の意味を持つとされてきたが,実際の会話ではそれにそぐわない現象が見られる。その一つが感謝・謝罪表現の併用であり,そこでは「すみません」系だけでなく「ごめんなさい」系の表現も使用されている。この併用事例を起点に本発表では二つの問題に取り組む。一つは,感謝をする場面において,謝罪表現と感謝表現それぞれにどのような相互行為上の機能が備わっているのか,もう一つは謝罪表現間でどのような機能の違いがあるのか,これらを会話分析の視点から明らかにする。その結果,謝罪表現は相手の自発的な与益行為への気づきや対応が遅れた際に用いられ,「すみません」系は感謝表現産出のタイミングと与益行為の完了点の調整に,「ごめんなさい」系はより大きな遅れに対応し,感謝表現と併用することで,与益行為への応答として構築されることが分かった。

  • 余 佳琳
    原稿種別: 研究会資料
    p. 128-133
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    日常会話では、道具が会話資源として会話に存在する。電子メディアは、情報を持ち運び・更新する機能を持つ道具として、会話者の会話を支える同時に、会話を変化させると見られる。本稿では、電子メディアであるパソコンを、会話におけるその形態から考察した。さらに今回は、単に道具としてのパソコンを探求するのではなく、身体の拡張という観点から、「第二顔」としてのパソコンの可能性を分析した。具体的には、「第二顔」を「第二目」と「第二口」に分けた。第一節の母語場面のデータでは、会話者が話をしながら視線を頻繁に往復させるという現象がとらえられた。この行動は、相手の志向線を追おうとしていると分析された。第二節の接触場面のデータでは、母語話者が相手のパソコンを長時間見ている場面が見られた。この行為は、言語能力を均衡にし、非母語話者をサポートする意図であると分析された。

  • 細馬 宏通
    原稿種別: 研究会資料
    p. 134-136
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    ヒトはものの形や重さを知覚しようとするときに、手を振ったり揺らす動作を行うことがある。このような知覚は生態心理学ではダイナミック・タッチと呼ばれている。一方で、ダイナミック・タッチによって得た知覚について互いに語ったり評価しあうときには、参与者は自分の得た知覚を表出しあう必要がある。では相互行為において、ダイナミック・タッチに伴う動作は、どのような発話とともに行われ、お互いの評価にどのように用いられるのだろうか。本研究では、日本語日常会話コーパスの事例から、重さに関する発話表出場面について発話と随伴する動作を分析した。その結果、実際にものを持ったときの腕の振りや揺すり動作に間投詞や重さに関する発話が伴い、重さの評価を強調していることがわかった。また、ものを持たないときにも、ものの重さを表出する発話と同時に、手を振ったり揺する動作が表れ、参与者間の重さの評価を組織化していることがわかった。

  • 酒井 晴香
    原稿種別: 研究会資料
    p. 137-142
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では、対面で行われている小売業の接客サービスにおいてしばしば見られる「お見送り」を分析対象とする。「お見送り」は、店内で会計を終えた後に、レジがある場所から店の出入口まで、退店を目的として客が歩いていく際、店員も付き添って一緒に歩いていく活動を指す。特に、郊外型ショッピングセンターのアパレル接客場面における常連客と店員の音声データを中心に、会計終了後からお見送りを経て別れに至るまでの参与者らによる言語的振る舞いを記述する。具体的には、3件のデータから、(1)お見送りの長さはさまざまであること、(2)お見送りの最中には会話が行われており、会話終結に向けた典型的な話題が採用されていること、そして(3)店の出入口に到着すると会話がすぐさま最終交換に至ることを示す。最後に、別れを繕う言語的手続きが極めて短いさまから、お見送りが名残惜しさを演出するための儀礼的な実践である可能性を述べる。

  • 鈴木 佳奈, 西村 太志
    原稿種別: 研究会資料
    p. 143-147
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    近年,共働き世帯の増加に伴い,家庭内での育児形態は「ワンオペ育児」から「チーム育児」(浜屋・中原2017)へと変化しつつある。チーム育児が機能するためには夫婦間のコミュニケーションが欠かせない。本発表では,子育て中の68組の夫婦への意識調査から,彼らが配偶者との日々の対話様態をどう評価しているのかを検討する。具体的には,・夫の家事育児分担割合に対する夫自身の意識と妻からの評価,・配偶者との会話時間についての相互評価,・夫の家事育児参加を促す妻の「促進行動」と,逆に参加を妨げる「批判行動」についての妻自身の意識と夫からの評価,について,夫婦の回答をペアデータとして分析する。夫と妻それぞれの回答から構成されるペアデータは,サンプルの独立性を仮定する一般的な統計的手法を適用するのは問題がある(清水2014, 2017)。本研究では試行的に複数の手法を使って,夫婦の回答の類似性を探る。

  • 高梨 克也
    原稿種別: 研究会資料
    p. 148-153
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    さまざまな専門職・専門教育でのスーパーバイズは傾聴と類似しているものの,スーパーバイザーは聞き取りを通じて仮説の形成と修正を行い,それに基づく解決策の提示に志向しているため,「仮説を形成・確証するのに不足している情報」を質問していくことが中心的になる.1980年代のエキスパートシステムは専門家の診断をAIで代行しようとするものだったが,成功を収めたとは言えない.実際のスーパーバイズのプロセスの丹念な記述は古典的Aiのどこに限界があったかを明らかにできる.形成される仮説はプロダクションルールの束ではなく,複数のスロットを持つフレーム構造に近いであろう.しかし,古典的フレームで各フレームを構成するスロットが既定であったのとは異なり,複雑な個別事例に対処できるスーパーバイザーによる仮説形成ではスロット自体が動的に発見されなければならず,この点がスキルの属人性と継承の困難さの原因の一つであった.

  • 前田 雄之介, 岡田 将吾, 井之上 直也
    原稿種別: 研究会資料
    p. 154-159
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    就職面接においてコミュニケーション能力は重要視される.これまでの研究では面接中の非言語的な振る舞いから被面接者のスキルを推定しようとしているが,面接評価における面接官の着眼点を考慮していない.本研究では就職活動において効果的な話し方とされるPREP話法の4つの構成要素(結論,理由,具体例,まとめの結論)に着目した.最初に,就職面接訓練で取得した被面接者の音声,言語,面接官の面接評価を含むデータを収集し発話書き起こしデータにPREP話法の各要素のアノテーションを行いデータコーパスを構築した.次に,PREP話法の各要素が付与された回答箇所の言語特徴量を抽出し面接評価点との関係を分析し面接評価点に関連するPREP話法に関連した言語特徴量を明らかにした.最後に,スキルの自動推定に応用することを目指しPREP話法の4要素を回答データに自動アノテーションするための分類問題に取り組んだ結果を報告する.

  • 丁 福建, 中谷 桃子
    原稿種別: 研究会資料
    p. 160-167
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    デザインの初期段階では、ユーザを共感的に理解するため、対象ユーザのニーズや価値観などの情報を大量に収集する必要がある一方で、高齢者は加齢による身体や認知機能の低下により、高齢者ユーザの情報を収集することが難しい。そこで、システムが声で質問を投げかけ、高齢者に声で応答してもらう対話システムによる調査手法を提案する。提案システムが質問を繰り出す戦略は、サービスデザイナーへのインタビューと、介護従事者・高齢者間の会話データから導出した。提案手法をWizard of Oz法を用いて評価した。具体的には、疑似的に対話システムを動作させ、高齢者と対話をしてもらうことで情報を収集した。同情報は、現場の介護従事者やデザイン専門家に評価いただき、対話システムの対話戦略を高齢者に適合するように改善した。提案手法の使い道と実用可能性について、関連するステークホルダーからポジティブな評価をもらった。

  • 水上 悦雄
    原稿種別: 研究会資料
    p. 168-169
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本報告では、情報通信研究機構(NICT)で開発・公開している、多言語音声認識評価用のデータセット(SPeech Recognition Evaluation Data Set:SPREDS)について、その概要を説明するとともに、利活用例などを、NICTの音声翻訳技術のデモとともに紹介する。SPREDSシリーズは、音声翻訳技術の研究開発促進のため、音声認識の開発段階にあわせた難易度設定をして、可能な限り言語間でその基準を保つように条件をあわせて開発したものであり、これまでに、発話タイプ(SPREDS-U1:22地域21言語)、談話タイプ(SPREDS-D1:日英)、講演タイプ(SPREDS-P1:15言語)を開発、公開している。報告内では2024年春ごろに公開予定の談話タイプ(SPREDS-D2:日本語)も紹介予定である。

  • 劉 礫岩
    原稿種別: 研究会資料
    p. 170-175
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    話題の境界,もしくは遷移の検出は,自然言語処理における課題の1つである.一方,話題の開始,終了などは会話参加者にとっても実践的な問題でありうる.本研究は,会話分析の手法を用いて,進行中ないし直前の話題に結びついてなされる行為連鎖を分析する.対象となる行為連鎖は,話題における参加者たちの知識,権利,義務などの分布から順当に推論されうるものである.行為の発話の組み立てにおいては,明確にその行為として理解できるような言語的特徴を持つ一方で,省略や指示などによって話題に結びついていることが示される.連鎖開始の行為は,「話しの流れ上」でなされたものとして,なんらかの意味で「弱さ」を持っているが,その「弱さ」を克服するための工夫がなされうる.その行為連鎖の完了が先行話題の完了でもありえて,また話題が行き詰まったときに,その話題を終了に持ち込むために行為連鎖が用いられうる.

  • 又村 拓也, 榎本 美香
    原稿種別: 研究会資料
    p. 176-179
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では、同時開始発話現象が連鎖終端の後に生じることを事例により示す。連鎖終端とは、隣接ペア第3部分などの連鎖を終結させる発話であり、さらにその後に続く笑いや発話休止によってマークされる会話中の位置である。分析資料として、千葉大学3人自由会話コーパス(4会話分)を用いる。2つ以上の発話が200ミリ秒以内に開始された箇所を同時開始発話と定義し、その直前に連鎖終端が多く見られることを示す。

  • 森 大河, 伝 康晴, Jokinen Kristiina
    原稿種別: 研究会資料
    p. 180-185
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究では相槌生成の認知的モデルを提案する。まず、TCUに対する相槌の生起位置を定量的に分析した。分析の結果、応答系感動詞はTCU内で頻繁に使用され、他の形態の相槌はTCU完了付近に使用されることがわかった。次に、長い順番の中で相槌がいつ、どのように使われるかを定性的に分析した。分析の結果、情報が未完結な位置では応答系感動詞が使われ、情報が完結した位置や予測可能な位置では他の形態の相槌が使われることがわかった。これらの結果をもとに、最後に相槌生成の2つの並行プロセスを提案する。

  • 池田 恵悟, 伝 康晴
    原稿種別: 研究会資料
    p. 186-191
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究は、自動車運転中、特に交差点での右左折時における運転手と助手席乗員間の視線の動きに注目し、助手席の同乗者が運転にどのように関与しているかを検討する。この分析には、日本語日常会話コーパス(CEJC)と新規に収録した会話データを使用した。新規データでは、車内の様子に加え,CEJCにはほとんど収録されていない車両前方の映像も収録した。分析の結果、右左折時に運転手と助手席乗員間で,安全確認や曲がる先を見るといった視線の動きで同調が見られた。この視線の動きは、助手席乗員が運転中の運転手にどのような働きかけを行なっているか示唆する。

  • 佐藤 友紀, 千葉 祐弥, 東中 竜一郎
    原稿種別: 研究会資料
    p. 192-197
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    対話の音声活動予測は,対話システムにおいてターンテイキングを自然にするために重要である.現在,音声対話において音声活動を予測するモデルや音声以外のマルチモーダル情報を取り入れたモデルが報告されている.しかし,これらのモデルは主に英語の音声データを扱っており,日本語を含むその他の言語への対応や言語間の違いに関する研究は少ない.本研究では,Ekstedtらが提案したTransformerベースの音声活動予測モデルを用い,複数の日本語データセットによる学習を行った.また,英語モデルを元に,日本語のデータセットを用いたファインチューニングを行った.そして,英語モデルとの比較やデータセットによる性能の比較を行った.その結果,日本語のデータから学習したモデルが日本語の音声活動予測に有用であること,および,英語モデルをベースとしてファインチューニングすることが性能の向上に貢献することが確認された.

  • 橋本 慧海, 中野 幹生, 櫻井 崇貴, 白松 俊, 駒崎 俊剛, 土屋 志保
    原稿種別: 研究会資料
    p. 198-203
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    大学病院では,看護師の離職率を低減し,個々のキャリアパスに対する理解を深めるために,看護師長などの看護管理者が定期的にキャリアに関する面談を行っている.そこで、看護管理者が行うキャリア面談の効率化と質の向上を目指し,面談前の準備段階としてスタッフのキャリアに関する情報収集を目的とした対話システムの試作を行った.看護管理者は本システムを通じて看護師の悩みや期待を事前に把握し,より効率化された面談を行うことが可能になる.本システムは,対話しながらスロットを埋めていき,その内容から対話の最後にレポートを作成する.しかしながら,スロットをあらかじめ固定してしまうと,個々の看護師の状況に合わせた対話ができない.そこで大規模言語モデルを用いてシステムが自律的に新しいスロットを生成し追加することで,柔軟な対話を行う方法を提案する.提案手法に基づいたシステムを構築し,柔軟な対話を行えることを確認した.

  • 長澤 史記, 岡田 将吾
    原稿種別: 研究会資料
    p. 204-209
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    本研究のゴールは、ユーザが話したいことや興味のあることを共有できるパートナーとしてのコミュニケーションロボットの実現である。本研究ではこのロボットの実現に向けて、マルチモーダル特徴から対話中のユーザの発話意欲を推定する機械学習モデルと、推定結果に話題の転換/継続を基づいて話題を切り替えて質問を行う適応的対話戦略を開発して評価した。最初に、発話意欲推定モデルとして、対話中のユーザーの姿勢や発話音声の韻律特徴からユーザーの発話意欲を推定するモデルを訓練し、交差検定により精度を評価した。その結果、ランダムフォレストによる推定モデルで発話意欲の高低を72.8%の精度で正しく推定できた。次に、適応的対話戦略を27人を対象としたインタビュー対話を行い評価した。結果、開発した適応的質問選択戦略を用いた場合では、ランダムに話題の転換/継続を行う場合と比較して意欲の高い発話の割合が有意に増加した。

  • 武田 海人, 松吉 俊, 兼松 祥央, 三上 浩司
    原稿種別: 研究会資料
    p. 210-215
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    テーブルトークロールプレイングゲーム(TRPG)は、複数の参加者がルールのもとでコミュニケーションをとりつつ、1つの物語を作りあげていく遊びである。TRPGには司会進行役であるゲームマスター(GM)の不足という問題がある。この問題に対して物語の筋道を示すシナリオに沿ってゲームの進行を行うよう試作したGM-AIでは、シナリオに記載のない話題への対応が課題として残っていた。本論文ではニューラルベースの応答生成を行う対話モデルを取り入れることで対応できる可能性を考えた。対話モデルを構築するうえで必要となるTRPGプレイの対話データを収集し、TRPGコーパスを作成した。TRPGコーパスを用いて対話モデルをファインチューニングし、生成した応答を評価することで、TRPGコーパスの有用性を検証した。対話モデルをGM-AIに導入してTRPGをプレイし、導入前と比較しどのような変化が生じるのかを報告する。

  • 大木 仁史
    原稿種別: 研究会資料
    p. 216-221
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    発話の意味が母語として成立していない双子男児の会話を区間グラフを用いて隣接行列の結合と分解を行いその固有値の変化と関係性を探った。

  • 神原 一帆, 野澤 元, 高橋 武志
    原稿種別: 研究会資料
    p. 222-227
    発行日: 2024/02/20
    公開日: 2024/02/20
    会議録・要旨集 認証あり

    文を理解する際には「誰が,誰に,…」という参与者の役割を明らかにする必要がある.このタスクは意味役割付与と呼ばれるが,多義性が問題となることがある.例えば"Alice replaced Bill"のAliceには,Billの立場を奪う動作主としての読みと,Billと入れ替わる対象としての読みがある.これらの差は動詞が喚起する事態(意味フレーム)の差に求められる.先行研究では意味フレームの同定に有生性などの参与者の意味クラスが有効になることが報告されているが,その同定に利用される意味クラスは恣意的に選定される.本研究では,生物であるか,ヒトであるか,自然物であるか,という三つの意味クラスの有効性を評価する.分析の結果,全体としての精度は大きく変動しないが,生物であるかという基準が最も有効であることが判明した.この結果をもとに,意味資源を構築する際の有効な意味クラスの特徴について議論する.

feedback
Top