人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
97回 (2023/2)
選択された号の論文の18件中1~18を表示しています
  • 森 清忠, 三好 康夫
    原稿種別: 研究会資料
    p. 01-04
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    YouTube等の動画共有サイトには様々な言語の動画が数多く投稿されており,第二言語学習者が視聴することで聞き取りの練習になることが期待できる。しかし,公開されている動画の多くはリスニング教材として制作されたものではないため,話者によっては特徴的なアクセント等を持ち,そのままでは学習者にとって聞き取りづらい動画も多い。そのため学習者は再生速度を聞き取り可能な速さに調整する方法をよく用いる。本研究では,速度調整との併用によりさらなる足場かけの効果を実現するために,動画内の話者のアクセントを学習者が母国語のアクセントに近付けて聞き取りやすい音声に調整できる環境の提供を目指す。そのための音声変換手法として敵対的生成ネットワーク(GAN)等を用いることを検討し,MelGAN-VCで音声を変換する実験を行った。その結果,ノイズを学習者が気にならない程度に抑えることは困難であることが確認された。

  • 井口 健太, 小島 有悟, 小林 葉, 髙井 智琉, 平田 彩乃, 矢木 陽, 小橋 拓司
    原稿種別: 研究会資料
    p. 05-10
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    これまで研究が乏しかった拍手という事象に着目し,「集合的行為としての拍手」を研究対象として,多人数集団による拍手の更なる解明を目指して研究を行った。本校体育館で行われたイベントにおいて,生徒や保護者を含む200人規模の集団の拍手の記録,分析をした。検証の結果,イベント開始時に発生する拍手の開始,終了,またイベント終了時に発生する拍手の開始は,発表者の発話の開始,終了などの周囲からの影響を大きく受けた。その一方,イベント終了時に発生する拍手の終了には個人特有の傾向が強く現れた。

  • 橋本 慧海, 白松 俊, 松本 宇宙, 青島 英和
    原稿種別: 研究会資料
    p. 11-14
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    近年,従来のトップダウンな組織運営から,メンバーがより自律的に仕事をこなすフラットな組織運営を目指す動きが増えている.しかし,階層的な組織に比べ,個人の自律性を尊重すると全体としてのマネジメントは難しくなる.そこで本研究では,個人の自律性を尊重しつつ,適材適所な組織運営ができるマッチング機構の開発を目指し,まずは個人の属性を聞き取るチャットボットを開発した.具体的には,Slack上でボットがユーザのスキルや興味などを推定し,個人属性タグを収集できるようなプロトタイプを試作した.また,評価実験を行い,タグ付けの性能を検証した.

  • 水上 悦雄, 村田 和代, 森本 郁代
    原稿種別: 研究会資料
    p. 15-18
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    近年、日本の各地で、行政主導による地域政策ではない、地域住民主体の"まちづくり"を促進するための様々な活動が行われてきている。行政が旗振り役として、地域住民を対象に開催される場合が多いように思われるが、民間主体で行政を巻き込んで開催される場合もある。本報告では、そのようなまちづくり活動プロジェクトを対象に、普段は話し合わないような多様な価値観を有する人々による地域の未来についての話し合いや活動が参加した人々に与える変容とその意義について、筆者の携わった事例を紹介するとともに、社会課題と話し合い研究について考察してみたい。

  • 伊藤 孝行
    原稿種別: 研究会資料
    p. 19
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー
  • 坂井 裕, 白松 俊, 織田 元樹, 小野地 光弘
    原稿種別: 研究会資料
    p. 20-23
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    本研究では,生活困窮者への音声ヒアリングを行う際の手助けとなり得るアプリの試作を行う。ヒアリングは,困窮者を適切な支援施設や支援制度へとつなぐ役割を持っている。しかし現在のヒアリングは,相談内容を書き留める行為や,相談所ごとに規定されたフォーマットにまとめる作業など,ヒアリングの妨げとなる行為が存在する。これらの問題点の解決を目指す。支援アプリを実際に用いることで,個人情報を含んだ生活困窮者のデータを収集することが可能となる。これにより,支援施設や支援制度へのマッチングを可能にする。また,個人情報の扱いに注意し,困窮要因オントロジーの構築も検討する。これにより社会問題の議論などへの応用も可能にする。将来的には,収集したデータからオントロジーの構築を行いたいと考えるが,本稿では,ヒアリング支援アプリによるデータの収集がまだ足りていないため,困窮要因オントロジーは人力で作成した。

  • 臼田 泰如
    原稿種別: 研究会資料
    p. 24-29
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    本発表では,日常会話を収録したコーパスが社会の記録にもなることを示し,関連する分析を行う.『日本語日常会話コーパス』は,国立国語研究所が2016年から2022年にかけて構築・公開を行なったコーパスであり,2010年代後半から2020年代初頭にかけての人々の日常生活の様子が,映像・音声およびテキストの形で収録されている.その構築期間の間に,私たちの日常生活はCOVID-19によって大きな変化を被っており,それはコーパスに収録されているデータも例外ではない.例えばレストランでの食事や海外旅行の相談といった,かつてはごく当たり前であった会話が数多く収録されている.本発表ではその一環として,COVID-19が流行し始めた頃に収録された,歯科クリニックのスタッフミーティングの様子を分析する.「感染」をめぐり,各参与者が家庭での日常とスタッフとしての立場を結節してふるまっていることが見てとれる.

  • 白松 俊, 末永 彩羽, 吉村 友希, 伊藤 孝行
    原稿種別: 研究会資料
    p. 30-37
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    2022年にOpenAIが公開したChatGPTやGPT-3.5は、プログラミングに無縁な人々にも広く浸透し、「AIの民主化」とも呼ばれる社会現象になっている。これら大規模言語モデルが生成する返答には嘘やフェイク情報が高確率で含まれるという問題はあるにせよ、非常に幅広いドメインに関して論理的な応答生成が可能である。フェイクが含まれる可能性があることを踏まえて活用すれば、議論の発散フェーズにおける発想支援や、社会課題解決に関するアイデアワークショップ(アイデアソン)などで活用できる可能性がある。また、ファシリテーターが行うような問いかけを生成したり、議論を構造化するためにも、大規模言語モデルが活用できる可能性がある。本稿では、GPT-3を活用したプロトタイプの評価実験や、ChatGPT上での社会課題解決に関する対話例を紹介し、その活用可能性を検討する。

  • 髙木 健斗, 乾 亮, 山村 毅
    原稿種別: 研究会資料
    p. 38-43
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    SNSの投稿は様々な情報を持つため有効な情報資源である.しかしSNS上の投稿は「おいしー」や「イ牛」など新聞等で用いられる表記とは異なる崩れた表記が含まれている.そのため自然言語処理による解析が難しく,特別な処理をする必要がある.本研究では崩れた表記の中でも分割表記文字に着目する.分割表記文字とは「動」を「重力」と表記するような,1つの文字を複数の文字に分割する文字を指す.先行研究ではOCRを用いて視覚的に分割表記文字の処理を行った.しかしOCRは文字認識による分割表記文字の判別手法であるため,文脈情報を用いておらず,訂正後の文の妥当性を考慮していない.そこで本研究では文脈情報を用いた分割表記文字の判別手法を提案する.文脈情報を持つモデルとしてN-gram,RNN,BERTの3つを利用する.これらを用いた分割表記文字の判別手法を提案し,正しい文字へ変換することができるか検証する.

  • 安川 浩貴, 水上 雅博, 品川 政太朗, 杉山 弘晃, 須藤 克仁, 中村 哲
    原稿種別: 研究会資料
    p. 44-49
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    人物の趣味や嗜好といった特徴を応答文に反映する応答生成モデルを実用的に運用するには,異なる人物同士の中間の発話者に相当する話者による応答生成が可能になるような,内挿可能な人物埋め込み空間を獲得していること,その人物埋め込みを目的に応じて制御しやすいことの2点が求められる。本研究では,内挿可能な人物埋め込み空間を獲得するのに向いているユーザ識別子が付属した大量の対話データと,人物表現の制御性の高いペルソナ文(人物の特徴を記述した文)が付属した対話データの2種類の対話データを混合して訓練することで,内挿可能で制御性の高い人物埋め込みを獲得し,この人物埋め込みを介してペルソナ文から応答生成を行える対話モデルを提案する.実験では,提案手法の有効性を示すために,人物埋め込みを明示的にモデリングしない従来の応答生成モデルとの比較を行い,また提案手法により獲得した人物埋め込みの内挿性と制御性を評価した.

  • 髙﨑 環, 吉永 直樹, 豊田 正史
    原稿種別: 研究会資料
    p. 50-55
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    対話システムが人と継続的に会話する際は、過去のやりとりを踏まえて応答を生成することが望ましい。しかしながら、応答生成の学習に用いる会話ログには、過去の対話文脈を踏まえた応答は必ずしも多くはなく、現在文脈に追加入力して応答生成モデルを学習するだけだと、十分に文脈を尊重した応答が生成されづらい。そこで本研究では、過去文脈をより参照した応答生成を行うためのマルチタスク学習手法を提案する。検索された過去文脈を強く参照するタスクとして、現在文脈と最も類似した過去文脈を生成するタスクを解く事例を追加し、応答生成モデルを学習する。追加タスクを解く事例は応答生成データセットにおける過去文脈抽出結果から構築可能で、追加のアノテーションが不要である。実験では大規模なTwitterデータセットを用いて学習・推論を行い、提案するデータ拡張手法によって訓練されたモデルの応答性能を検証した。

  • 水上 悦雄
    原稿種別: 研究会資料
    p. 56-61
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    本研究は、「会話が盛り上がっている」「会話が停滞している」「互いに譲らない言い争いが続いている」など、話し合いの場で見られるような観察可能な会話状況・状態のまとまりを話し合いの「相」と定義し、この相が別の相に変わることを「相転移」と呼び、この相境界周辺で、何が起きているか、を観察、分析することで、同じような状態(相)から—それが必要であれば—脱出するための知見、あるいは話し合い参加者の変容に影響を与え得る要因についての知見が得ることを目的としている。本発表では、話し合いの参加者、特に一人の発言者が延々と主張を続けている状態から「引く」プロセスを、いくつかの話し合いデータを例として分析、考察する。

  • 梁 勝奎
    原稿種別: 研究会資料
    p. 62-67
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    日常会話によくみられる謝罪表現「ごめん」は、どの位置に用いられるかによって相互行為上の働かいが異なる。本研究では自分がすることの影響を受ける可能性がある人にそのことを知らせる「断りを入れている表現」と一緒に使われる「ごめん」に注目する。特に、断りを入れる発話の前に位置する「ごめん」がどのような相互行為上の働きをしているかについて会話分析の手法を用いて考察する。上述の位置における「ごめん」は、単に次の発話の内容だけに関係があるのではなく、断りを入れる目的になる活動がどのようなタイプのものであるのかも重要だと考えられる。断りを入れる発話形式や内容は様々であり、その中でも話者個人の領域に関することではなく、相手の領域や他の参与者と共有する領域とかかわりがある場合、謝罪表現「ごめん」を発話の前に用いて自分には権限があまり権限がないけど行っていることを示す資源として使われていると考えられる。

  • 仲本 征矢, 堀内 靖雄, 原 大介, 黒岩 眞吾
    原稿種別: 研究会資料
    p. 68-73
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    高精度な光学式モーションキャプチャで計測されたデータを用いて、日本手話の直線的な手の動きの音素を分析した。分析の結果、6方向(上下前後左右)の動きの音素を持つ単語について、各音素の異音はカテゴリカルに収束しており,概ね離散的に分離できることが明らかとなった.

  • 齋藤 光輝, 古谷 優樹, 小倉 功裕, 光田 航, 東中 竜一郎, 高汐 一紀
    原稿種別: 研究会資料
    p. 74-79
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    対話において共通基盤を構築することは重要である.我々は先行研究において,モダリティが豊富な状況で社会的関係性が親密な作業者ペアが遠隔対話を通じて特定の課題を実施した際に,共通基盤構築が円滑に進むことを発見した.本研究では,先行研究で収集された対話データを対象に,共通基盤構築が円滑に進む要因の分析を行った.その結果,要因の一つとして,モダリティが豊富な状況で社会的関係性が親密な作業者間では,交替潜時が有意に長いことが明らかになり,交替潜時が長い場合,一方の作業者の問いかけに対して他方の作業者が熟慮したのち返答を行っている傾向が見られた.これらの結果から,具体的な内容を伴なう発話の多寡が共通基盤を円滑に構築する要因の一つとなっていることが示唆された.

  • 水谷 林太郎, 鈴木 寿
    原稿種別: 研究会資料
    p. 80-85
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    3Dアバターを裸眼立体視ディスプレイに投影するマルチモーダル傾聴対話システムを開発した.本システムは相槌,共感,オウム返し,モダリティに応じた応答,相互の質問などの傾聴対話をベースにした音声コミュニケーションに加えて,表情,視線,瞬き,頷き,姿勢ミラーリングなどの非言語情報からなる多元的な伝達手段を有する.大学の学部生と院生からなる60人の参加者が,アバターと一対一の密室において,趣味,好き/嫌いな食べ物,将来の目標,悩み,休日の過ごし方,子供の頃の思い出,部活やサークル,アルバイト,失敗談その他について自由に3分間程度の会話をおこなったのち,22項目の感性評価に回答した.アバターの話の聞き方や共感の示し方などの傾聴姿勢が参加者から高い評価を得た.加えて、アバターが親身だと感じ,またアバターと話したい,と感じる参加者が多数派であることが確かめられた.

  • 三井 陸矢, 堀内 靖雄, 黒岩 眞吾
    原稿種別: 研究会資料
    p. 86-91
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    同じ発話内容の平静音声と感情音声のペアのデータに対して、声の高さ、速さ、音色の各韻律の変動の度合いを表現可能な特徴量を提案する。この特徴量は時系列で計測することが可能であると同時に発話全体で平均をとると発話全体の特徴量としても用いることができる。これら3種類の特徴量と感情音声の強度の評定結果との回帰分析の結果、各特徴量は韻律付与の強度を表現できる妥当性が示された.これらの特徴量を用いて韻律の時系列解析をした例も示す。

  • 福田 樹人, 有本 泰子
    原稿種別: 研究会資料
    p. 92-97
    発行日: 2023/02/27
    公開日: 2023/02/27
    会議録・要旨集 フリー

    本研究は,不意に笑ったゲームプレイヤーに仮想世界を自動的に反応させることで,現実世界と仮想世界の無意識なインタラクションを実現することを目指している。本報告では,プレイヤーの笑い声に対して呈示したゲームイベントが与える心的影響を心拍,発汗,大頬骨筋,皺眉筋から検証し,笑い声に応答するゲームイベントがプレイヤーを仮想世界に惹きつけるのか明らかにする。実験条件は,プレイヤーが笑ったときにゲームイベントを呈示する笑い条件と、笑っていない場面でゲームイベントを呈示する非笑い条件の2つである。2つの条件を分散分析で比較した結果,笑い条件では心拍数が減少し,発汗が増大,大頬骨筋が非活性化する一方で,非笑い条件では心拍数が減少し,大頬骨筋と皺眉筋が活発化することがわかった。笑い声に応じたゲームイベントの呈示が,単にゲームイベントを呈示した時とは異なる感情を誘発することが明らかになった。

feedback
Top