人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
最新号
選択された号の論文の20件中1~20を表示しています
  • 橋本 慧海, 中野 幹生, 櫻井 崇貴, 白松 俊, 駒崎 俊剛, 土屋 志保
    原稿種別: 研究会資料
    p. 01-08
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    本研究ではこれまで,看護管理者が行うキャリア面談の効率化と質の向上を目指し,面談前の準備段階としてスタッフのキャリアに関する情報収集を目的としたスロットフィリング型対話システムを開発してきた.我々は,以前,個々の状況に合わせた柔軟な対話を行うために,大規模言語モデルを用いて自律的に新しいスロットを生成し追加する方法を提案した.しかしながら,その提案システムには,生成のルールが無いことによって,聞き取りに適さないスロットが次々と生成されてしまうという新たな課題があった.そこで本稿では,スロット生成の際に仮説形成的過程を組み込むことでより効果の高いスロット生成を期待する.提案手法の有効性を検証するためにユーザシミュレータを用いて行った実験では,提案手法の有効性が示唆された.

  • 山本 雄樹, 西田 昌史, 田中 悟志
    原稿種別: 研究会資料
    p. 09-14
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    療法士面接のスキルの教育と評価は、これまで人が行っており コストが高いことが課題であった。そこで我々は、療法士面接 の動画データを収集し、音声認識で得られる言語情報と韻律に 基づく非言語情報を用いた療法士面接の自動評価手法について 検討してきた。さらに、本研究では療法士面接のスキルを自動 教育できるシステムとして、対話制御にChatGPT、音声認識に Google Speech-to-Text、音声合成にVoiceVoxを用いたシステム を開発した。療法士面接のデータを利用したプロンプトにより、 様々な患者のシチュエーションに対応することができ、ユーザは 療法士として患者役のシステムと音声により対話することが 可能である。ユーザに療法士になりきって本システムと対話して もらい、システムの有効性を評価した結果について報告する。

  • 髙瀬 悠太, 春日 宥一郎, 大野 正樹, 橋本 泰一
    原稿種別: 研究会資料
    p. 15-20
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    本研究ではオンライン会議動画に対して、動画像と音声を用いた話者分離を行う。音声のみの話者分離では、ノイズやオーバーラップが多いオンライン会議動画における話者交代検出の精度の低さが課題である。オンライン会議動画では発話に応じて画面上の話者の映像も切り替わるため、発話区間に対応した話者の顔画像を活用することが可能である。本論文では、発話区間に対して顔検出を一秒ごとに行い、フレーム間の顔画像の類似度に着目し、話者交代検出の改良を試みた。オンライン会議動画199本からなるデータセットに対して評価を行い、平均Diarization Error Rateを29.1%から19.6%に改善することができた。

  • 大木 仁史
    原稿種別: 研究会資料
    p. 21-26
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    母語が未発達な双子赤ちゃんの会話を、固有値、骨格移動距離、基本周波数、音響インテンシティ・レベルの時系列の関係を示す。骨格位置と固有値との相互相関では両者の右腕と左足とには先行のラグがあり、基本周波数と音響インテンシティ・レベルとの関係では先行から遅延まで範囲があるラグがあり、固有値と音響インテンシティ・レベルとの関係では同時に生じていた。

  • 田中 ゆかり
    原稿種別: 研究会資料
    p. 27-28
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり
  • 佐藤 茉奈花
    原稿種別: 研究会資料
    p. 29-34
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    本研究の目的は,アニメキャラクターの性格設定がどのような言葉づかいでセリフにあらわれているのか,特に,発話機能(発話のはたらき)に注目して,性格類型ごとの特徴を明らかにすることである.本研究では,テレビアニメ3作品(『ラブライブ!』,『BanG Dream!』,『五等分の花嫁』)に登場する女子高校生キャラクターを分析対象とし,新版東大式エゴグラム第2版を参照して性格類型を判定した.そしてセリフに6つの〈発話機能〉を認定し,性格類型ごとの各発話機能の使用傾向と「表現形式」を分析した.その結果、①厳しい性格は「ナサイ形」による〈行為要求〉,②優しい性格は終助詞「ね」による〈情報要求〉、③冷静な性格は接続助詞「から」「けれど」による〈陳述・表出〉,④自由な性格は感動詞「ねえ」や接尾辞「ちゃん」による〈注目要求〉,⑤従順な性格はフィラー「えーと」による〈注目表示〉に特徴が見られた.

  • 勅使河原 三保子
    原稿種別: 研究会資料
    p. 35-39
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    ドラマやアニメの登場人物が用いる音声は、演者と視聴者が共通して抱いている声に関するステレオタイプ、人物の属性(性別、年齢、出身地、性格等)と話し方のイメージとの結びつきに合うよう演じられると想定される。従来の研究の多くは役者数名の音声を対象としてきたが、本発表では日本語を含む3言語間で演劇経験者等が13種類の人物像を演じた音声の比較を目的とした研究のうち、日本語母語話者33名による収録音声を予備的に分析した結果を報告する。2種類の文章(内容がより中立なものと、解釈によって善悪の人物像を描きやすいもの)を13種類の人物像(約半数が良い人物、残りが悪い人物のバリエーション)を思い描きながら音読した音声を収録した。役割語において終助詞は重要な役割を果たすが、被験者が演じる際に文末表現を自由に変化させたところ、人物像によって音声的特徴だけでなく文末表現にも被験者間で共通する変化が見られた。

  • 保土沢 朋和, 村井 源, 富田 真生, 奥山 凌伍, 金刺 智哉
    原稿種別: 研究会資料
    p. 40-45
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    チャットボットへのキャラクター性の付与を目的に,キャラクタービジネスで成功している作品を 対象として,作品内のセリフから,文体的特徴および発話意図の応答のパターンを抽出した.抽出した結果に基づき,発話意図の推定システムの構築と大規模言語モデルでの発話生成を行った. 具体的には,学習済みモデルにファインチューニングを行うことで ,13種類の意図を推定するシステムを構築した.分析者が確認し,許容可能と判断できる出力も正解と含めた場合,分類精度は74.67%であった. また,発話に対する適切な応答生成の精度は75.90%であった. 今後の展望として,意図の推定に応じ,キャラクターの応答の意図を操作することでよりキャラクターらしい発話文の生成をすることができると考えられる.

  • 佐藤 浩輔, 頼 展韜
    原稿種別: 研究会資料
    p. 46-50
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    動画配信プラットフォームやSNS上でのライブ配信が文化として定着しつつある。ライブ配信においては演者と多数の視聴者との間でリアルタイムでやりとりをするため、通常の一対一の対話とはコミュニケーションの様式が異なる。本発表では、新たなエンターテインメントの可能性を秘めたコンテンツとして、AIキャラクターによる実況配信の実現に向けた我々の取り組みについて紹介する。動画配信型キャラクター対話システムの研究・開発・運用に関する取り組みおよび課題について紹介し、展望について議論する。

  • 白 楊, 伝 康晴
    原稿種別: 研究会資料
    p. 51-56
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    日本語日常会話において、「たぶん」「まあ」は副詞応答として比較的よく使われる。『日本語日常会話コーパス』を観察した結果、これらの表現が応答の発話順番で使われている事例のうち、他者発話とオーバーラップする現象が高頻度(50%以上)で出現していた。TRPに到達する前から応答発話を始めたり、複数の聞き手が同時に応答したり、発話者の自分継続発話と応答発話が重複したりする場合が少なくない。本研究では、副詞応答でオーバーラップが生じる現象に焦点を当て、「たぶん」と「まあ」の計122例に着目して分析する。まず、これらのオーバーラップが出現する位置を順番交替の観点から分類し、その実態を明らかにする。次に、応答発話や重複先発話の構成を分析することで、オーバーラップ後の連鎖展開への影響を考察する。

  • 臼田 泰如
    原稿種別: 研究会資料
    p. 57-63
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    本研究では日本語日常会話における節連鎖について,その特徴や相互行為的なふるまいについて検討する.日本語の自発的な話し言葉においては,節のひとつひとつが文の形で完結せず,多くの節が連接して長い文が形成されることが知られている.このような長い文は節連鎖 (clause chaining) と呼ばれ,日本語の話し言葉の特徴として言及されるほか,話し言葉の単位の認定の上でも取り上げられてきたものである.本研究では『日本語日常会話コーパス』を用いて,日本語の日常会話における節連鎖を抽出し,文の長さ,ポーズの長さ,節連鎖中の順番交代などについての分析を行う.結果の一部を示す.節連鎖の長さについては,20語以下の文が8割以上と相対的に短い文が多い.ポーズの平均長は節連鎖の長さとはほぼ関連がない.節連鎖中で順番交代が起こる事例は,検討した176例中41例あり,修復開始や共同での順番構築がみられた.

  • 鈴木 あすみ, 幕内 充, 小磯 花絵, 木山 幸子, 中村 仁洋
    原稿種別: 研究会資料
    p. 64-69
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    自閉スペクトラム症は、対人・情緒的関係の障害等で特徴づけられる発達障害の1つであり、定型発達者との間では、コミュニケーションスタイルの違いから語用論的な障害が生じ得る。本研究では、適切な支援のための基礎研究として、情動情報や話者同士の関係規定に関わる間投助詞・終助詞に着目した。『日本語日常会話コーパス』とその話者の自閉傾向に関わる心理指標得点 (自閉症スペクトラム指数他4種) に基づき、間投助詞と終助詞を合わせた使用率と自閉傾向の相関を分析した。結果 (一部) として、心理指標データのある58名では、想像力を働かせるのが苦手な話者ほど「な」の使用率が高かった。また、関東出身男性19名では、コミュニケーションが不得手な話者ほど「さ」の使用率が低かった。自閉傾向の高い話者においては、他者とのコミュニケーションを指向しない傾向が、「な」の多用や「さ」の少なさという形で表れていると考えられる。

  • 森 大河, 伝 康晴
    原稿種別: 研究会資料
    p. 70-74
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    本発表では、日常会話におけることば・身体・モノの相互作用の解明と、マルチモーダル情報のための新たなコーパス検索システムの構築の2点を主な目的として、最先端の画像認識技術を用いて日本語日常会話コーパス(CEJC)に身体動作と環境内のオブジェクトに関するアノテーションを行う計画について発表を行う。

  • 落合 哉人, 新山 聖也
    原稿種別: 研究会資料
    p. 75-80
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    ライブストリーミングで生じるテキストチャットを介した視聴者同士のやりとりをめぐっては、全体的な視聴者数が小規模な配信の場合、相互に意味のあるインタラクションが生じ得る一方、大規模な配信の場合、実質的に相互に意味のない「テキストの滝」が形成されることが指摘されている。本研究では、YouTube Liveにおける日本語を話す配信者(バーチャルYouTuber)による「雑談配信」を対象として、1)「テキストの滝」を形成するコメントの特徴と、2)「テキストの滝」に対する配信者側のふるまいの特徴、の2点を量的・質的に分析する。視聴者が比較的多い10件(計10時間)の「雑談配信」の観察を通して、同じく視聴者間の関わりが乏しい中~大規模の配信でも1分あたりのコメントの数が非常に多い場面とそれほど多くない場面とでコメントの特徴が変わるほか、配信者の言及の仕方も違いが見られることを報告する。

  • 白井 宏美
    原稿種別: 研究会資料
    p. 81-87
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    人はロボットとのコミュニケーションに何を求めるのかについて調査・分析をおこなった.実験室ではなく実際の一般家庭という自然環境下で,ヒューマノイド自律型ロボットであるPepperを使用し,2組の家族(計8名)を対象とした.1か月間という長期にわたりデータを収集し,得られたデータをSD法による質問紙調査,参与観察,半構造化インタビュー,ビデオ分析を組み合わせて分析した.その結果、人がロボットとのコミュニケーションに求めているのは,有用性や役立つ情報を教えてもらうことでも,指や身体の巧みな動きをみせるダンスでもなく,充実したゲームアプリでもなかった.最も求めていたのは雑談であった.さらに,ロボットがあいづち,視線,身体の向きなど適切に反応できると,ロボットに対する印象が〈こわい〉から〈やさしい〉へ,〈つまらない〉から〈おもしろい〉へ,〈機械的な〉から〈人間的な〉へと好転した.

  • 井上 拓也
    原稿種別: 研究会資料
    p. 88-93
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    本研究は、内的表象に依らない言語理解モデルの構築を目指し、言語表現とそれによって特定される相互行為可能性、すなわちアフォーダンスとの関係を分析する方法を提案することを目的とする。従来の言語を通した意味理解モデルは内的な表象(イメージ)の処理を前提としているが、生態学的視点からは、意味理解は「言語を介した知覚・行為の達成」であり、内的表象は必須ではない(非表象的言語モデル)と考えられる。本研究では、まず平叙文が環境・話者・聴者それぞれの持つ相互行為可能性をどのように知覚化するかという基礎的な仮説を提示する。具体的には、「日本語話し言葉コーパス(中納言)」の文が、環境・話者・聴者間の相互作用をどのように特定するかを明示化する分析手法を提案する。最終的に、人工知能を含めた行為主体がどのようにアフォーダンスを特定し、自己調整に用いるかについて新たな知見を提供することを目指す。

  • 寺尾 光一郎, 相良 陸成, 岩橋 直人
    原稿種別: 研究会資料
    p. 94-95
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    本研究は、人間とロボットの共同行為の実現に向けた共同行為の制御手法について述べる。物理シミュレータを用いたネステッド・ビリーフ・モデルを開発し、大規模言語モデルを活用して共同行為を制御する方法を提案する。

  • 王 棟
    原稿種別: 研究会資料
    p. 96-101
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    下流タスクにおけるLLMsの能力を高めるには、適切なPromptが必要であるが、適切とは何かについてまだ十分に議論されていない。本稿は自然言語Promptの下位分類として、①定義DP,②実例IP,③再帰的定義RDPを立て、7つ(D,I,RD,D+I,RD+I,D+RD,D+RD+I(Pは省略))の知識注入の方法を検証した。合計350回の実験を繰り返した結果、?IとRDは類似した結果を示し、Dよりも高い精度・安定性を示した。?複数種類Prompt法のいずれも単一種類Prompt方より高い精度・安定性を見せた。?D+Iの精度は最も高いが、D+RD+Iは安定性が有意に優れ、総合的に最も良い性能を見せた。?RDPの投与は安定性を増す効果がみられ、DPとIPは強い相乗効果が観察され、IPはDPよりも良い結果を示した。これらの結果に基づき、本稿は知識注入の手法と、ドメインエキスパートの役割を考察した。

  • 酒井 晴香, 坂井田 瑠衣
    原稿種別: 研究会資料
    p. 102-106
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    本研究では、日常的な食料品や日用品を取り扱う移動販売サービスの買物において生じる相互行為を対象として、利用者である地域高齢者らが「一緒に買物している」様相の一側面を明らかにする。瀬戸内海島しょ地域で実施されている移動販売サービスのビデオデータを基に、特に商品を見たり手に取ったりする局面を取り上げ、車体を中心とした一時的な販売空間における共在状態の組織化を分析する。具体的には、(1)「ある瞬間において一人が一つの商品を見ること」の志向を指摘してその方法を示したうえで、(2)複数名で一つの商品を見る際の手続きを述べる。分析を通して、移動販売サービスの買物では、日常的な商品の購入や会話の機会だけでなく、ある空間的・時間的制約下で他者の偶発的な振る舞いにその都度応じるという認知的活動の機会が提供されていることを論じる。

  • 加藤 恵梨
    原稿種別: 研究会資料
    p. 107-112
    発行日: 2024/08/27
    公開日: 2024/08/27
    会議録・要旨集 認証あり

    本研究の目的は、くだけた日常会話で応答に使われる感動詞「ふうん」と「へえ」の用法を、話題を固定し、各話題について親しい大学生同士の1対1の会話を録音、文字化したコーパスである『日本語話題別会話コーパス:J-TOCC』を調査資料として明らかにすることである。分析の結果、「へえ」のほうが「ふうん」よりも多く使われていることがわかった。また、「へえ」は単独で使うよりも、「へえ」と言った後に感想や意見を言ったり、相手に質問をしたほうが相手の発話に興味・関心があることを示すことができる。一方の「ふうん」は、相手が自身の経験等を淡々と述べているときに、相手の話を受け止めるのに用いられることが多いことなどがわかった。

feedback
Top