人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
93回 (2021/11)
選択された号の論文の46件中1~46を表示しています
  • 寺西 帝乃, 荒木 雅弘
    原稿種別: 研究会資料
    p. 01-08
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    発問による主体的・対話的な教授で学習者の深い学習を実現するためには、学習者の解答を分析し、フィードバックを与えるために詳細な評価をする必要がある。学習者の解答のような短文を評価する技術をAutomatic Short Answer Grading(ASAG)と言う.近年のASAGでは大規模な言語モデルにより、高い精度での評価が可能となっている。しかしながら、既存のデータセットは正解か不正解かの単純な評価しか付与されておらず、また既存の手法は模範解答との単語の一致率に依存した評価を行う傾向にあるため、フィードバックのための詳細な評価を行うことができない。そこで本研究では高等学校の授業科目である情報Iに関する発問と解答例を収集し、7段階の評価ラベルを付与したデータセットを構築した。また、情報Iに関する解答例を詳細に評価するため、教科書の知識グラフを用いた評価手法を検討し、既存の手法と比較した。

  • 山本 賢太, 井上 昂治, 河原 達也
    原稿種別: 研究会資料
    p. 09-14
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    ロボットなどの音声対話システムにおいて人間らしい対話を実現するために重要な要素としてキャラクタ表現がある.状況やユーザに応じてキャラクタを使い分けることで,ユーザの対話に対する満足感が向上することが期待される.先行研究では,システムのキャラクタは事前に設定されている.本研究では,ユーザのパーソナリティに応じてシステムのキャラクタを使い分けるユーザ適応の実現を目指す.キャラクタはパーソナリティ尺度を用いて定義する.はじめに,WOZ法で収録したロボットと人間との1対1対話のデータに対する印象評定実験を実施した.対話動画を視聴して,ロボットと人間に対してそれぞれのパーソナリティと両者の相性の印象評定をしてもらった.パーソナリティの評定結果をクラスタリングし,分類結果と相性評定結果との関係を分析した.その結果,ユーザのパーソナリティに対して相性のよいキャラクタの組み合わせがいくつか確認された.

  • 佐伯 真於, 松浦 瑠希, 鈴木 駿吾, 宮城 琴佳, 小林 哲則, 松山 洋一
    原稿種別: 研究会資料
    p. 15-20
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    日本人の英語スピーキング能力を正確に測定するためには,学習者の習熟度に適切な難易度の課題を用いて、十分な発話サンプルを引き出すことが重要である.しかし,既存のスピーキング能力判定では人工的な状況を与えて一定の制限時間内にモノローグ発話をさせる等,現実的な会話状況を反映していないことが指摘されてきた.本研究では,バーチャル会話エージェント InteLLA(Intelligent Language Learning Assistant)による適応的な英語スピーキング能力判定システムを提案する.InteLLAには,英語能力の逐次的な予測,ユーザの言語的な上限を特定できるような会話破綻の状況に応じた質問の難易度や対話行為を調整する対話制御が実装されている.本発表では,ユーザとInteLLAの約10分間のインタビューを行いユーザのスピーキング能力を評価する様子を紹介し,今後の展望について述べる.

  • 高井 幸輝, 李 晃伸, 戸田 隆道, 東 佑樹, 下山 翔
    原稿種別: 研究会資料
    p. 21-25
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    電話予約タスクの自動音声対話システムにおいて、ユーザーが対話の途中で一方的に離脱してしまう問題が頻発する。これに対して、ユーザー音声からネガティブ感情の認識を行うことで離脱を予測し、対話シナリオの修正や動的な発話誘導を行うことが考えられる。しかし、実際の自動音声対話における感情認識のためのデータは少ない。本研究では、異なるドメインの感情音声データセットを用いて事前に学習した感情分類モデルを転移学習することで、ネガティブ感情の認識の精度向上を行う。精度の比較を行った結果、転移学習による分類モデルが優位であり、転移学習が効果的であることが示された。

  • 高津 弘明, 安藤 涼太, 中野 鐵兵, 柏川 貴弘, 木村 浩一, 松山 洋一
    原稿種別: 研究会資料
    p. 26-31
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    イジングマシンによりユーザごとに最適化された発話計画に基づいて効率的で一貫した展示物解説を行うミュージアムガイドシステムを提案する.発話計画生成問題を,談話構造と合計発話時間の制約もと,ユーザの興味度が最大となる文集合を抽出するQUBO(Quadratic Unconstraint Binary Optimization)モデルで定式化した.提案手法を評価するために,談話構造とユーザのプロフィールおよび作品とその解説文に興味度を付与したテキストコーパスを構築した.このデータセットを用いて,シミュレーテッドアニーリングベースのイジングマシンであるデジタルアニーラによりQUBOモデルを実用的な時間で制約違反なく解くことができることを確認した.また,主観評価実験を行い,提案手法で生成したシナリオに基づいてバーチャルミュージアム上の展示物を解説することの有効性を確認した.

  • 吉田 快, 品川 政太朗, 須藤 克仁, 中村 哲
    原稿種別: 研究会資料
    p. 32-37
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    ペルソナ対話システムに対する既存のアプローチでは,いくつかのテキスト記述を明示的なシステムのプロファイルとして組み込むことが試みられている.

  • 佐久間 仁, 藤江 真也, 小林 哲則
    原稿種別: 研究会資料
    p. 38-43
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    多人数会話向け音声対話システムが発話をする詳細なタイミングをself-attentionを用いたアーキテクチャで推定する手法を提案する.音声対話システムの発話タイミングが適切でないと円滑な会話を行うことができない.また,適切な発話タイミングは会話の文脈によって異なる.提案手法はself-attentionを用いたアーキテクチャで複数のモダリティから会話の文脈を捉え,発話タイミングを推定する.

  • 佐良 和孝, 滝口 哲也, 有木 康雄
    原稿種別: 研究会資料
    p. 44-49
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    近年,ニューラルネットワークを用いた対話システムに,文書や知識グラフといった,外部知識へのアクセス機能を持たせる研究が盛んに行われている。しかしながら,このような機能を持つ対話システムを実現するためには,通常の応答生成モジュールに加え,知識検索のためのモジュールが複数必要になり,システム全体の学習, 推論が複雑になるといった問題や.システム全体のパラメータ数が多くなるといった問題がある.そこで,本研究では,上記全てのモジュールが事前学習済み言語生成モデルを用いて,Text-to-Textで学習, 推論可能であるフレームワークを提案する。提案手法は, Adapter層を用いたマルチタスク学習を用いることで,システム全体のパラメータ数の削減が可能になる.自動評価を用いた比較の結果,一般的なSeq2Seqで学習された対話システムに比べ、提案手法は優れた応答を生成できることが分かった..

  • 金崎 翔大, 河野 誠也, 湯口 彰重, 桂井 麻里衣, 吉野 幸一郎
    原稿種別: 研究会資料
    p. 50-55
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    エントレインメントは対話における話者間の言語使用の傾向が互いに類似するような現象であり,対話のタスク成功率や自然性,対話意欲と相関することが報告されている.対話システムの応答選択/応答生成をエントレインメントを考慮して制御することでシステムの応答性能の向上を試みた研究があるが,与えられた対話文脈に対してシステムがどの程度のエントレインメント度合いで応答すれば良いかを適切に決定するようなモデルについての十分な検討は行われていない.そこで本研究では,対話システムの応答における理想的なエントレインメント度合いを決定するために,人間の対話におけるエントレインメントを模倣するような予測モデル構築した.評価実験の結果,提案したエントレインメン予測モデルは,経験的に基づいて構築された単純なベースラインモデルと比較して,高い性能で各ターンにおける応答のエントレインメントを予測できていることを示した.

  • 渡辺 稜哉, 千葉 祐弥, 能勢 隆, 伊藤 彰則
    原稿種別: 研究会資料
    p. 56-61
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    機械と人間のより円滑なコミュニケーションを実現するための手法として,人間らしい応答が可能な対話エージェントを導入することが挙げられる.近年,対話エージェントの応答の韻律や表情をニューラルベースの手法で個別に制御する手法が検討されている.これに対して我々は,言語,韻律,表情の複数のモダリティを用いてエージェントの表情と韻律の両方を制御するためのエンコーダー・デコーダーモデルを提案する.実験から,複数のモダリティ,特に表情モダリティを入力として利用した場合に客観評価値が向上することを確認した.また,マルチタスク学習を行うことで全体的な性能がさらに改善する可能性が示唆された.

  • 黒田 佑樹, 武田 龍, 駒谷 和範
    原稿種別: 研究会資料
    p. 62-67
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    ユーザ発話内容の解析に偏重することなく,システム発話の列をコントロールするだけで,聞き役の対話システムを実現することを目指している.我々は以前,システム発話の整合性を重視した発話選択を,Q学習を用いて実装した.さらにより多くの状態を考慮可能な強化学習を実装するために深層強化学習(DQN)を用いる.本稿では,以前実装したQ学習と同等の発話選択の実現を今回の目標として,深層強化学習を設計したので報告する.まず,Q学習で用いていた状態をone-hotベクトルを用いて入力表現とした.次に報酬として,これまで用いていたものを正規化して与えた. 評価としては,テキスト対話を行い,システム発話の破綻数を以前の手法と比較することで,同等の性能が再現できているかを調べた. 加えて,十分に学習できるまでのエピソード数の比較を行った.

  • 秋山 一馬, 稲葉 通将
    原稿種別: 研究会資料
    p. 68-69
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    ゲームや漫画などの登場人物をモデルにしたキャラクター対話システムの研究では,ほとんどの場合,対話データを人手で作成する必要がある.そのため,データの作成,データの品質の確保,キャラクターに関する事実関係の網羅には多大なコストがかかる.そこで,本研究では小説を対象とし,地の文やセリフからキャラクターの性格や事実関係を表すペルソナを抽出し,そのペルソナを持つ対話システムを構築する手法を提案する. 提案する対話システムは3つのモデルからなる.(1)小説からペルソナを抽出するモデル,(2)ペルソナに基づく発話生成モデル,(3)生成された応答をキャラクターの口調に変換するモデルの3つである.上記のモデルにより,小説を入力することで,小説内のキャラクターのペルソナをもった対話システムを自動的に構築する.

  • 岸波 洋介, 赤間 怜奈, 佐藤 志貴, 徳久 良子, 鈴木 潤, 乾 健太郎
    原稿種別: 研究会資料
    p. 70-73
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    対話において説得や交渉,特定の話題への誘導を試みる際には,目標を達成できる自然な対話の流れを設計し,それに沿って能動的に対話を進めることが重要である.このとき,相手の発話は必ずしも事前に想定していた通りのものになるとは限らないため,一つの戦略として(1)ある時点から目標までの対話の流れを設計したうえで,(2)相手の発話に応じてその流れを更新していくことが考えられる.本研究では,誘導したい話題などの目標に向かって能動的に対話を進行可能な対話システム実現に向けて,まずは(1),つまりシステムが一人二役で目標を達成できる自然な対話の流れを設計する手法を提案する.具体的には,知識グラフを用いて目標を達成可能な道筋の候補を作成し,応答生成モデルにより,作成した道筋を辿りながら自然な発話系列を生成する.実験では,提案手法の有効性を「特定の話題へ誘導する対話の設計」という問題設定で検証する.

  • 市川 熹
    原稿種別: 研究会資料
    p. 74-79
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    対話は精神的負担が軽い(人に優しい)ことが望ましい。日常用いている音声対話では、「実時間」で話すと同時に消える(揮発性)にもかかわらず楽に(精神的負担が軽い=省エネ)円滑に対話を行っている。製品開発に用いられるシステム的アプローチを参考に「日常対話のことば」の実時間性構造の検討をおこなった。製品開発では、製品に求められる「外部仕様」とその仕様の実現手段が備えるべき「内部仕様」に分け、実現手段の各部分を製品全体の中に位置づけ、仕様を満たすように構成する。本報告では、人に優しい特徴(揮発性、省エネ性、実時間性)を前者、「対話のことば」のインフラを構成する「言語情報レベル」と「生体機能レベル」の各要素及びそれらの要素間の関係(相補機能など)が備えるべき機能・特性を後者とみなし各要素を検討した。なお、「語用論レベル」はアプリと見做し対象としていない。仕様を満たす可能性の高い構成を報告する。

  • 橋本 樹, 榎本 美香
    原稿種別: 研究会資料
    p. 80-85
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    4人以上の多人数会話では、全員が一つの話題を話している時と複数のグループに別れて異なる話題をグループごとに話している時がある。複数のグループに分かれることを「分裂」、別れていたグループが一つにまとまることを「統合」と呼ぶことにする。本研究では、6人でピザを作っている場面を分析し、分裂と統合がどのようなきっかけで発生するかを明らかにする。分析の結果、1. 一部の人にしか分からない限定的な話題が開始される、2. 異なる作業が始まるという2つの契機により分裂が開始されることが分かった。また、1. 全員の関心を引く突発的な出来事が起こる、2. 分裂していた会話の話題がそれぞれ終結する、3. 限定的な話題が終息するという3つの契機により統合がおこることが分かった。多くの統合は分裂の終結によって生じており、諸般の事情により分裂しても詰まるところは一つの話題に戻るということが指向されていると考えられる。

  • 山下 紗苗, 東中 竜一郎
    原稿種別: 研究会資料
    p. 86-91
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    チャットボットやコールセンターの自動応答などでは,いまだ完全に自律したやり取りは難しく,必要に応じてオペレータが介入する必要がある.介入をする場合,オペレータはそれまでの対話の流れを把握する必要があるため,対話要約が有用だと考えられる.本研究では,雑談を対象とし,対話に介入するという状況において,どのような対話要約が有用かを調査した.具体的には,人手の生成型要約,直前N発話の抜粋型要約を含む6種類の対話要約を用いた介入実験を行い,介入のしやすさや対話の自然性を評価した.その結果,直前5発話を提示する場合に対話の自然性が最も高いことが分かった.

  • 東中 竜一郎, 船越 孝太郎, 高橋 哲朗, 稲葉 通将, 赤間 怜奈, 佐藤 志貴, 堀内 颯太, ドルサ テヨルス, 小室 允人, 西川 ...
    原稿種別: 研究会資料
    p. 92-100
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    本稿では,対話システムライブコンペティション4について述べる.我々は対話システムを聴衆の前で動作させ,鑑賞・評価を行うイベントである対話ライブコンペティションを2018年から実施してきた.今回で本イベントは4回目となる.任意の話題で雑談を行う能力を評価する「オープントラック」と所定のシチュエーションで人間らしい対話を行う能力を評価する「シチュエーショントラック」がある.本稿では,本イベントの仕様を述べるとともに,各トラックにエントリされたシステムの概要や予選結果について述べる.本選は,第12回対話システムシンポジウムのセッションとして開催予定である.

  • 長澤 春希, 工藤 慧音, 宮脇 峻平, 有山 知希, 成田 風香, 岸波 洋介, 佐藤 志貴, 乾 健太郎
    原稿種別: 研究会資料
    p. 101-106
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    本稿では対話システムライブコンペティション4のオープントラックに提出したシステムについて述べる.本システムは,応答生成機構と応答フィルタリング機構から構成される.応答生成機構では,多様な学習データをもとにマスチタスク学習を施した複数のアーキテクチャの生成モデルや,知識ベースを利用したテンプレートベース応答生成システムを用いて,多様な応答候補を生成する.生成した候補のうち,自然かつ適切な情報を提供していると判断された応答文を応答フィルタリング機構により決定する.本システムの構造や学習方法について解説するとともに,同コンペティションの予選で実際に本システムと対話したクラウドワーカの評価結果やコメントをもとに本システムを分析した結果について述べる.

  • 杉山 弘晃, 有本 庸浩, 水上 雅博, 千葉 祐弥, 中嶋 秀治, 成松 宏美
    原稿種別: 研究会資料
    p. 107-112
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    近年,Transformer Encoder-decoderモデルをSNS等の大規模なテキスト対話データで事前学習し用いることで,自然な対話を実現する手法が盛んに研究されている.事前学習モデルの構築には大きなコストがかかるため,一度構築したあとは同一のモデルを使い続ける事が多い.しかしその場合,モデル自体が持つ知識が徐々に古くなってしまい,発話のベースとなる常識がずれてくることで,対話が噛み合わなくなる問題がしばしば発生する.本研究では,時期等の異なるデータで事前学習モデルを追加訓練した場合に,生成される発話がどのように変化するかについて分析する.

  • 山崎 天, 坂田 亘, 川本 稔己, 小林 滉河, Nguyen Tung, 上村 卓史, 中町 礼文, 李 聖哲, 佐藤 敏紀
    原稿種別: 研究会資料
    p. 113-118
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    本稿では、対話システムライブコンペティション4のオープントラックに提出した対話システムについて述べる。本システムはTransformerをベースとした言語モデルの「HyperCLOVA」を用い、ユーザの発話に応じて選択するFew-Shotプロンプトを利用して応答候補の生成を行う。プロンプトは4種類あり、一般的な応答生成、知識応答生成、ペルソナ一貫性を考慮した応答生成、短文抑制のための応答生成を目的としたものをそれぞれ用意し、組み合わせて利用する。後に、不適切な発話を除去するフィルタリングを行うことで、最終的な出力を得るシステムとなっている。予選の結果では1位を獲得し、大規模言語モデルが雑談応答生成に有効であることを示したが、攻撃的な応答生成をはじめとしたいくつかの課題が顕在化した。本稿では、大規模言語モデルを用いた雑談応用における現存の課題や今後の方向性を議論する。

  • 乙武 香里
    原稿種別: 研究会資料
    p. 119-124
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    NTTドコモのxAIML SUNABAを用い,対話システムライブコンペティション4のシチュエーショントラック用の対話システムを作成した.このシステムの最も特徴的な点は,キャラクタの付与である.後輩が先輩を飲み会に誘うが,先輩は断ろうとするという状況であることから,「相手の反応をあまり気にせずグイグイくるが,明るく快活で憎めない後輩」をシステムに設定した.こうすることで,システムがユーザーの発話に噛み合っていない返答をしても,その人らしさは保たれ,返答の不自然さがカバーできると考えた.キャラクタは,発話内容とそれを繰り出すタイミングを調整することで設定した.常に噛み合わない返答をするのでは人らしさは損なわれてしまうため,ユーザーの発話を予測して発話の分岐を工夫した箇所もある.キャラクタを刷り込む場面,会話が噛み合っている場面,噛み合っていない場面をシナリオの構造とともに説明する.

  • 久保 祐喜, 生嶋 竜実, 二瀬 颯斗, 武田 龍, 駒谷 和範
    原稿種別: 研究会資料
    p. 125-130
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    本稿では,第4回対話システムライブコンペティションのシチュエーショントラック用に開発したシステムを紹介する.対話のシチュエーションは,複数ターンを通じてユーザに飲み会への参加を依頼することである.我々は,人らしい対話を実現するために,対話破綻や一つの話題への固執を抑えることを目標とした.まず,対話破綻を抑えるために,ルールと用例を用いてシステム発話を選択した.ユーザの発話内容が少数に限定できそうな場面ではルールを使用し,ユーザの発話内容が多様となる場面では用例を使用してシステム応答を選択した.システムの発話表現に質問や要求を積極的に用いることで,ユーザの発話内容を誘導した.また,話題が停滞するのを抑えるために,特定のターンで決まった発話をすることで,話題の流れを誘導した.この結果,シチュエーションに適した対話を実現し,用例やルールを用いることで効率的にシステムを実現した.

  • 川本 稔己, 山崎 天, 坂田 亘, 佐藤 敏紀
    原稿種別: 研究会資料
    p. 131-136
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    本稿では、対話システムライブコンペティション4のシチュエーショントラックに提出した対話システムについて述べる。本システムはTransformerをベースとした言語モデルの「HyperCLOVA」を用いて応答生成を行った。言語モデルには対話履歴だけでなく、状況や発話者のペルソナをFew-Shotのプロンプトとして入力することでシチュエーションに沿った応答生成を可能にした。また、シチュエーションに沿わない応答を生成した場合に備えて、応答開始語句を指定した後に再度生成を行う機構を備えている。その結果、本システムは予選で2位の成績を収め、日本語の大規模言語モデルがシチュエーションに沿ったタスク指向対話の応答生成に有用であることを確認した。一方で、生成文には時折Hallucinationが起こることにより、発話の信頼性や対話の一貫性に未だ課題が残る。本稿では、予選の対話ログを参照し課題の議論を行う。

  • 白井 宏美
    原稿種別: 研究会資料
    p. 137-142
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    第4回対話システムライブコンペティション予選1位通過において,本システムは「気遣いができるところが人間らしい」というコメントを多く得ることができた.人間らしい会話に求められる「気遣い」とは何か,語用論の知見をどのように活かして気遣いができる対話システムを作ったのかについて述べる.

  • 得丸 久文
    原稿種別: 研究会資料
    p. 143-148
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    通信理論の信号対雑音比は、言語理解においても決定的に重要な役割を果たす。家族や仲間との日常会話に求められる雑音レベルと、学習や業務に求められる雑音レベル、研究や発明に求められる雑音レベルの違いについて検討する。

  • 徳永 清輝, 田村 和弘, 大武 美保子
    原稿種別: 研究会資料
    p. 149-154
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    超高齢社会を迎えた日本において、ますます高齢者として健康で充実した生活を送ることは大きな関心を集めている。対話は高齢者の生活の質を維持するための重要な要因であると考えられているが、その介入効果は明らかになっていない。既存の対話ロボット関連の研究では、高齢者宅に対話ロボットを置いて、高齢者に対話ロボットを使わせたといった報告がされているが、手順の再現が難しいこと、また高齢者の在宅時の実験条件を統制することが難しいといった課題がある。 そこで先行研究として、著者らは対話型ロボットシステムを用いて、高齢者が在宅で認知機能トレーニングを行うシステム(DBSPS)を提案している。 本稿では、提案システムを用いて合計80名弱の健常高齢者に対して約1か月間介入実験を行った際の実証実験を通して学んだ教訓ならびに実験時の工夫、インタビュー結果について整理し報告する。

  • 井上 昂治, Lala Divesh, 河原 達也
    原稿種別: 研究会資料
    p. 155-160
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    音声対話システムがユーザとの関係性を構築・維持するためには、ユーザに対して共感を示すことが重要である。共感を示すためのふるまいとして笑いに着目するが、適切なタイミングで適切な笑いを生成することは高度な対話理解を要する。そこで、本研究ではユーザが先行して笑った場面に限定し、そこでシステムも笑う「共有笑い」の生成に取り組む。提案システムは、(1)ユーザの笑いの検出、(2)システムによる共有笑いの有無の予測、(3)システムの笑いの種類の選択、これら3つのモジュールで構成される。各モジュールの入力は先行するユーザ発話の音響特徴である。著者らが収録したお見合い対話データを用いて各モジュールのモデルを学習した。特に、(2)共有笑いの有無の予測では、ベースライン(ランダム)よりも高い精度で予測できることを確認した。

  • 戸田 隆道, 友松 祐太, 杉山 雅和, 邊土名 朝飛, 東 佑樹, 下山 翔
    原稿種別: 研究会資料
    p. 161-162
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    株式会社AI ShiftはAI Messenger Voicebotという音声自動対話サービスを提供している. AI Messenger Voicebotは電話口での対応の自動化を目的としている. 自治体などを中心に予約や質問応答などカスタマーから電話を受ける入電(インバウンドコール)だけでなく, サービス側からの架電(アウトバウンドコール)にも対応している. 電話での音声自動対話は音声劣化による音声認識誤りの影響や大量接続の負荷, 自動応答に不慣れなユーザーへの対話誘導など独自の課題が存在する. 本発表では実際に音声自動対話サービスを運用して直面した課題や今後の展望について紹介する.

  • 小林 優佳, 久島 務嗣, 吉田 尚水, 永江 尚義, 岩田 憲治
    原稿種別: 研究会資料
    p. 163-164
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    音声対話システムは自然な発話で使用できるため近年注目されている。音声対話ビジネスでは開発・運用時のコストを抑えることが重要であり、我々は深層学習・強化学習を用い、対話コーパスから自動で構築できる低コストなタスク指向音声対話システムを開発している。本対話システムは、運用時のキーワード追加のためのコスト削減の仕組みや、ユーザが入力する際に発生しうる未知キーワードに対する適切な応答機能を搭載しており、それらの機能は、キーワードリストをモデルの外部に保持し、キーワード追加時にキーワードリストの更新のみで再学習を必要としない対話状態推定技術や、発話のキーワード以外の文脈情報を使用して、未知キーワードを検出する発話理解技術で構成されている。また、顧客のQAリストだけを使用し、複数回のやり取りによる絞り込み対話を提供可能なQA対話システムを開発・製品化している。本発表ではこれらの対話システムを紹介する。

  • 信田 春満, 張 磊, 笠原 健治
    原稿種別: 研究会資料
    p. 165-166
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    世界初の「ディープラーニング技術を用いて言語生成し会話する家庭用コミュニケーションロボット」として認定された自律型会話ロボット Romi とその技術について紹介する.本稿では Romi の紹介と全体的な技術要素の構成の説明を行い, Romi の主要な2つの会話エンジンである ScenarioGraph と Cooper について説明する.ScenarioGraph はルールベースの会話を行うエンジンで主に天気予報を聞くなど機能的な会話に使用され, グラフで表現された会話ルールに従って会話を行う. Cooper は Romi のおよそ9割の会話を担う Transformer ベースの会話エンジンであり, Encoder 部分と Decoder 部分を統合することで比較的小さなサイズのモデルでも高品質な会話を短いレスポンスタイムで行えるよう工夫されたモデルである.しかし,このようなシステムのペルソナは初めに設定されたもので固定されており,事前に設定されたプロファイルから自動的に更新することができない.例えば,条件づけられていないペルソナについての質問がシステムに入力された場合には,システムが新たなペルソナを含んだ発話を生成する可能性がある.そのため,システムが一貫した対話を行うにはこのような新たなペルソナも考慮する必要がある.そこで本研究では,ペルソナ対話システムが発話履歴に応じて自身のペルソナを自動で更新するという新たな問題設定を考え,これを実現するために,ペルソナ追加機構を持つペルソナ対話システムを提案し,その際に起こりうる問題の影響の調査を行った."

  • 土居 誉生, 森 克利, 嘉門 勇輝, 稲田 徹
    原稿種別: 研究会資料
    p. 167-168
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    顧客接点において対応品質向上や運用効率化のためにFAQサイトやFAQベースのチャットボットは有用であるが、高品質なFAQの構築や維持をいかに小さなコストで実現できるかが課題となる。データに基く典型的なアプローチではFAQは応対ログ(電話やチャット等での問合せと応答の履歴)を基に作られる。この作業コストの削減は、より多くの応対ログからよりタイムリーにFAQを整備できることにつながる。NANQは応対ログからFAQ候補を自動抽出するシステムである。本稿ではNANQの特徴とそれを用いた評価実験を紹介し上記の課題に対する有効性を示す。

  • 趙 天雨, 沢田 慶
    原稿種別: 研究会資料
    p. 169-170
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    We have developed two types of pre-trained models, GPT-2 and RoBERTa, that are trained from a public corpus consisting of about 75-gigabyte texts. The models and its training code have been released under licenses that allow for commercial use. By fine-tuning the released models, users will be able to accomplish a variety of Japanese natural language processing tasks with high task accuracy.

  • 伊島 翔大, 田中 昂志
    原稿種別: 研究会資料
    p. 171
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    業務の補助、お問い合わせ対応、エンターテインメントなどといった多岐にわたる分野で、チャットボットが注目を集めており、多くの企業、自治体などで導入が進んでいる。チャットボットでは、ユーザーの質問に対して最適な回答を返せているかが重視されるが、当社「サポートチャットボット」では、ソーシャル(SNS)データを利用した言語解析機能を用いることで、ユーザーの質問に対して高い回答率を実現している。また、多くのユーザーがチャットボットに対してより親しみを持ってもらえるよう、雑談生成システムの開発も同時に行っている。今回は、ユーザーローカルが提供している「サポートチャットボット」の紹介と、現在開発を行っている雑談生成システムのデモを行う。

  • 松山 洋一
    原稿種別: 研究会資料
    p. 172-173
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    新型コロナウイルス感染症蔓延に伴うオンライン教育のニーズの高まりも背景として,早稲田大学の研究グループが培ってきた会話AI技術をフル活用した英会話教育支援システム開発と,大規模な実証実験に取り組んでいます.早稲田大学が開発・実施し高い効果を上げてきたコミュニケーション志向英会話プログラムTutorial Englishの実績・ノウハウを活かし,英語教育の専門家とAIが連携して受講者の英語コミュニケーション能力を判定したり,学習者と教育者の双方に対して納得感のあるオンライン授業システムを社会実装することを目指しています.具体的には(1)大規模英会話データ収集・分析エコシステムの構築(2)対話指向英語スピーキング能力自動判定システムの開発(3)スマートな英会話学習体験環境の開発等の研究開発テーマから構成されています.(NEDO「人と共に進化する次世代人工知能に関する技術開発事業」として実施中)

  • 中辻 真, 立石 修平, 小瀬木 悠佳
    原稿種別: 研究会資料
    p. 174
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    NTTレゾナントは「教えて!goo」における恋愛相談AIオシエルや、日本テレビ社に提供したキャラクタチャット「AI菜奈ちゃん」など、多くの対話サービスを提供してきました。対話AIは広く普及し、現在では、様々なサービスをユーザが享受する際のインタフェースとして不可欠となっています。本講演では、レゾナントが進める、「音声、映像、言語の3モダリティを統合し、対話、ユーザ代行など、幅広いサービスを支える基盤となるAIアルゴリズムAPIサービスを紹介します。AI suiteにより、クライアント企業様の希望するサービスを迅速に構築できます。今回、本基盤を支えるPersonalized AI技術やマルチモーダル技術も紹介し、映像、音声、言語を統合した対話例とし、「ユーザアバタとAIキャラクタのエンタテイメント会話デモ」と「雑談を交えユーザ代行を行うAI」を紹介します。

  • 港 隆史, 境 くりま, 船山 智
    原稿種別: 研究会資料
    p. 175-176
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    発表者らは,これまでのアンドロイド研究で開発してきた技術を踏まえて,簡単な指令で対話において必要な人らしい動作をアンドロイドロボットに行わせる対話動作制御ミドルウェアを開発した.アンドロイドの表情,視線を向ける対象物,発話テキスト等を指定するだけで,人らしい動作を自動的に生成でき,アンドロイド制御システムの開発経験がない者でも簡単にアンドロイドを制御することができる.また,簡単な制御指令で制御できるため,遠隔制御システムも簡単に構築できる.これを用いて発表者らは,WebRTCを利用してWebブラウザ上で映像・制御コマンドを多地点間で通信するシステムを構築した.これによりオンラインで被験者と対話するロボットを遠隔で制御することができる.本発表では,オンラインで対話ロボットを評価する実験の試みを紹介する.

  • 木元 颯人, 稲葉 通将
    原稿種別: 研究会資料
    p. 177-179
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    本研究はユーザがインタビュー動画を撮影することで,撮影された動画を用いて対話システムが構築できるフレームワークを提案する.本フレームワークにより臨場感のある対話システムを手軽に作成することが可能になると考えられる.作成する対話システムは,撮影したインタビュー動画から話者の発話区間だけを自動で切り出し,入力発話に応じて動画を動的に切り替えることで応答する.構築する対話システムは実在の話者の動画を用いるため,実際にその人物と話しているような臨場感が得られる.

  • 上垣 貴嗣, 清水 健吾, 菊池 英明
    原稿種別: 研究会資料
    p. 180-185
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    近年, 人と雑談を行う非タスク指向対話システムが社会に普及してきている. 非タスク指向対話システム研究の目的の一つとして, 友人同士のようなコミュニケーションの達成がある. 友人同士のようなコミュニケーションを達成するためには, システムがユーザーに対し積極的に踏み込むような発話をする必要がある. 話者のコミュニケーション上の姿勢や対人配慮の観点でコミュニケーションについて検討した理論であるポライトネス理論において, 相手に積極的に踏む込む発話戦略はポジティブ・ポライトネス戦略と呼ばれる. ポジティブ・ポライトネス戦略に含まれる「からかい」のユーモアは, 親しさのメタメッセージという形でユーザーに親しみを感じさせ, 対話継続欲求を向上できると考える. 本研究では, 「からかい」のユーモアについて応答生成を目的としたコーパスの作成と, それを利用した分類モデルによるデータ拡張を行なった.

  • 瀧 和男, 古和 久朋
    原稿種別: 研究会資料
    p. 186-191
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

     音声で被検者と対話するCGエージェントが、医療従事者に代わって認知機能検査を自動で行う業界初のシステムを設計・試作した。検査・診断の検査フェーズ(採点含む)を医療従事者が行うのと同じグレードで実施、検査コスト低減、検査場所・時間の制約緩和を目指し、医療外サービスへの適用も予定する。発表時には検査のデモも行う。 システムは音声・CG映像・画像・テキストを出力し、利用者の音声を入力とするマルチモーダル対話システムである。4種、約40分間の検査を自動で行い採点する。検査の内容・手順・採点法は規格に従っておりアルゴリズム化可能だが、対話シナリオに基づく状態更新、表示・採点タスク、時間管理が複雑に入り組んだ特徴を持ち、AIKoのシナリオ記述仕様が実現を可能にした。開発期間は1年で、今後評価・改良予定。神戸大学で実施中の認知症予防プログラム(名称:コグニケア)を当初利用先とする。

  • 稲葉 通将, 東中 竜一郎, 千葉 祐弥, 駒谷 和範, 宮尾 祐介, 長井 隆行
    原稿種別: 研究会資料
    p. 192-197
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    人が他者とコミュニケーションを行う際,語彙や話す速さ,敬語の有無などを相手に応じて使い分けている.しかし,現在の対話システムでは,ユーザに応じて話し方を変更することはほとんどなされていない.対話システムがより効率的にタスクを達成したり,ユーザの満足度をより高めるためには,ユーザに応じて対話戦略などを変更することが望ましい.我々は,話し方の変化に大きく影響を与える要素として話者の年齢に着目し,児童から高齢者まで幅広い年齢層の話者によるマルチモーダル対話コーパスを収集した.対話内容として,幅広い年代が興味を持つ旅行に着目し,旅行代理店における観光相談を元にしたタスクを設定した.本稿では,タスクの詳細,対話データの収集方法と収集結果,および収集したデータの分析結果について述べる.

  • 岡本 拓, 納土 知樹
    原稿種別: 研究会資料
    p. 198-201
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー
  • 斎藤 里美
    原稿種別: 研究会資料
    p. 202-205
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    背景と目的:日本人の日常会話では終助詞「ね」の使用が欠かせないと言われる一方、日本語学習者の「ね」の過剰使用が失礼に感じられるとの指摘がある。そこでI-JAS「多言語母語話者の日本語学習者横断コーパス」の海外環境、国内自然環境、国内教室環境の学習者および日本語母語話者計875人分の対話データから「ね」の使用を調べた。結果:100万語あたりの「ね」の使用頻度は母語話者>国内自然環境>国内教室環境>海外環境の順に多かった。「ね」の過剰使用ではなく、母語者とは異なる使用が学習者過剰使用の印象につながっている可能性がある。また、母語話者は男女、年代問わず協力者50人全員が終助詞「ね」を使用していた。今後の展望:「ね」の調査から、母語話の対話に「共話」的な特徴や、終助詞「か」から終助詞「ね」での応答、終助詞「よね」で共感するような対話が見られた。今後そうした点を数値的に明らかにしていきたい。

  • 郭 恩孚, 南 泰浩
    原稿種別: 研究会資料
    p. 206-209
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    本論文は我々のチームが対話システムライブコンペティション4に提出したシステムについて報告し、分析を行う。本システムはTransformer Encoder-Decoderモデルを用いて、ユーザーの発話を考慮し、システムの発話を生成するシステムである。事前学習はwikipediaとtwitter対話データ、ファインチューニングではtwitter対話コーパスを用いた。ライブコンペティションの結果としては6位になり、不適切な発話の生成などの問題点が挙げれた。最後に、実際の対話例を用いた分析、改善案について述べる。

  • 斉 志揚, 秋山 一馬, 稲葉 通将
    原稿種別: 研究会資料
    p. 210-213
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    本稿では,対話システムライブコンペティション4のシチュエーショントラックに出場したUECILについて述べる.今回のシチュエーションはシステムがユーザを誘い,ユーザはそれを断るという設定である.しかし,ユーザによる誘いを断る理由は数多く考えられるため,ユーザの応答を最初から最後まで予測した完全なシナリオの創出は難しい.しかし,より短い単位のシナリオ,例えばあるシステム発話に対し,ユーザ発話を予測して次のシステム発話を作成することは比較的容易である.そこで,本システムでは,ユーザ発話との類似度と一貫性を考慮し,短い単位のシナリオおよび用例を選択することで,対話を進める.

  • 坪倉 和哉, 永野 葉月, 入部 百合絵, 北岡 教英
    原稿種別: 研究会資料
    p. 214-217
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー

    本稿では,対話システムライブコンペティション4のオープントラック部門にエントリーしたシステムについて述べる.現在の対話システムは,自然言語処理技術の発展に伴い対話応答精度が向上しているが,依然として対話システムが不適切な応答をしてしまう対話破綻が生じている.そこで対話破綻検出に関する研究が多く行われている.対話破綻検出ができれば破綻を事前に回避したり,破綻の回復を行うことができる.従来研究では主に,破綻の事前回避が目的とされているが,人間同士の対話でも文脈の理解不足や聞き間違いなどにより不適切な応答を行う場合があるため,対話システムも同様に,破綻が発生してしまうことは避けられない.そこで本研究では,従来研究では十分に検討されていない対話破綻が発生した際の破綻回復処理の検討を行った.

  • 長井 隆行
    原稿種別: 研究会資料
    p. 218
    発行日: 2021年
    公開日: 2021/11/20
    会議録・要旨集 フリー
feedback
Top