人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
選択された号の論文の942件中451~500を表示しています
  • 玉井 敬一, 大久保 毅, ヴィン チュオン ズイ チュオン, 名取 直毅, 藤堂 眞治
    セッションID: 2Q6-OS-20b-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    深層学習のより広範な社会実装に向けて,深層学習をベースとした技術をひとびとがより安心して利用できる状況を整え,より優れた環境性能を発揮する学習手法の追求を目指す上で,現存する深層学習アーキテクチャに通底する原理の探求は避けがたいステップである.その一環として,本論文では,適切に初期化された全結合ニューラルネットワークおよび畳み込みニューラルネットワークにおける信号伝搬過程が,「吸収状態転移」と呼ばれる,平衡から遠く離れた系が示しうる自然現象のダイナミクスと強力なアナロジーを持つことを示す.これらの人工ニューラルネットワークが,吸収状態転移を記述する理論的枠組みにおいてどのように位置づけられるか,このアナロジーがいわゆる「平均場理論」的な理解を超えてどのような理論的・実際的示唆を与えるかを,信号伝搬過程の数値シミュレーションによって得られる定量的な結果とともに論じる.

  • 篠田 和彦, 大西 健史, 杉山 将
    セッションID: 2Q6-OS-20b-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    近年の深層学習技術の著しい発展は大量のラベル付きデータの収集,処理が可能になったことによる部分が大きいが,現実にはラベル付きデータの収集が困難な状況も多い.この問題を解決するための技術の一つとして,ラベル付きソースドメインのデータからラベル無しターゲットドメインのラベルを推定する,教師なしドメイン適応が盛んに研究されてきた.一方で,ターゲットドメインでの雑音ラベルは,ヒューリスティックやクラウドソーシング,または簡易なモデルを用いることで,比較的容易に入手できる.本研究では,このようにターゲットドメインで雑音ラベルが取得できる場合の新しい問題設定と,その雑音ラベルを活用する方策を提案する.またいくつかのベンチマークデータセットを用いて,雑音ラベルがソースドメインからターゲットドメインへの知識転移を助け,ラベル推定精度が向上することを実験的に示す.

  • 河野 駿介, 山本 泰生, 梶 大介
    セッションID: 2Q6-OS-20b-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    近年,分散配置されたデータから学習する手法として連合学習 (Federated Learning: FL)が注目されている.FLはプライバシーの保護やデータ通信量の低減などの利点を持つ⼀⽅で,サーバ側でデータ収集を行わないため各クライアントのデータ分布を特徴づけることが一般的には困難である.本研究ではサーバ側により構築される全データ対応の一般モデルの学習と各クライアントが一般モデルの情報を利用することで所有データの特徴抽出と学習を行う新たな連合学習スキーム (自治型連合学習) を提案する.また,画像データを用いた予備実験により提案手法の有⽤性を一般モデル/個別モデル/データ特徴抽出それぞれの性能の観点から実証的に示す.

  • 平嶋 宗
    セッションID: 2R1-OS-10c-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    学習は思考の結果として生起するものであり,学習に資する思考は,学習内容に関するものであるとすることができる.学習支援を学習に資する思考を促すものであるとすると,思考の対象である学習内容が学習支援を設計するうえで本質的な役割を果たすといえる.本稿では学習内容のモデルをドメインモデルと呼び,このドメインモデルに基づく学習支援の設計に関して論じる.さらに,このような方法で設計された学習支援から得られる学習者のデータの有用性についても検討する.

  • 長期的非言語インタラクションによる競争感誘発の可能性
    本多 昂生, 田和辻 可昌, 松居 辰則
    セッションID: 2R1-OS-10c-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究では、学習時に仲間意識を芽生えさせ、学習意欲向上につながるPeer Learning環境を提供するコンパニオンロボットのことを学習支援Peerコンパニオンロボットと呼ぶ。本研究の目的は学習支援Peerコンパニオンロボットの動作モデル構築を目指した、ロボット動作による「Peerさ」の誘発の能否を明らかにすることである。そのために、以下のことを行なった。 1)学習時に「Peerさ」を感じる心理的要因の関係性を示した階層性をもつ心理モデルの構築、2)心理モデルとロボット動作との関係性調査、3)短期的インタラクションにおける心理モデルに沿ったロボット動作による「Peerさ」誘発の検討、4)長期的インタラクションにおける心理モデルに沿ったロボット動作による「Peerさ」誘発の検討。現段階の結果として、心理モデルの作成並びに短期的インタラクションによる「Peerさ」の誘発の可能性を確認した。ただし、「競争感」に関しては長期的インタラクションでの検討が必要であるとの結論を得た。本稿においては心理モデルの作成の詳細並びに短期的インタラクションに着目した「Peerさ」誘発実験の詳細について報告する。

  • 柏原 昭博
    セッションID: 2R1-OS-10c-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Web調べ学習とは,調べたい課題に関連したWebページを単に検索エンジンを用いて検索することではなく,学習向けに構造化されていないWeb空間を学習者が主体的に探究しながら,課題の関連項目や項目間の関係を網羅的かつ体系的に学ぶことである.また,そのために学んだ項目の中からさらに調べるべき項目を抽出し,部分課題として展開(課題展開)して課題を構造化することである.これは,学習者自ら学習シナリオを作成することに相当する.本稿では,課題展開における批判的思考までも考慮した学びのモデルデザインについて述べ,事前に解を想定できないような学びをいかに支援すべきかについて論じる.

  • 荒巻 洸太, 宇都 雅輝
    セッションID: 2R1-OS-10c-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    記述・論述式試験の問題点の一つとして,採点結果が評価者の特性に依存してしまう点が挙げられる.この問題を解決するために,一般化多相ラッシュモデルと呼ばれる,評価者の特性を考慮した項目反応理論が提案されている.一方で,受験者集団や評価者集団が異なる試験にこのような項目反応理論を適用して,試験結果を比較するためには,それぞれのテストから推定されるパラメータの尺度を合わせる「等化」と呼ばれる手続きが必要になる.一般的な等化手法は,共通受験者や共通評価者が存在するように試験を設計し,共通部分をアンカーとしてモデルパラメータを推定することで行う.しかし,現実の試験場面では,共通受験者や共通評価者を用意できない状況もしばしば存在する.そこで本研究では,最先端の深層学習自動採点技術を用いることで,一般化多相ラッシュモデルに基づく記述・論述式試験の等化を行う手法を提案する.実験の結果,提案手法により,共通受験者や共通評価者を用いることなく,一定の精度で等化が実現できることがわかった.

  • 十文字 智人, 相川 野々香, 東本 たかひと
    セッションID: 2R1-OS-10c-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    学習において,理解を深めるために自身の解答を振り返り,自主的に試行錯誤を行うことが重要である.これまで,数学におけるベクトルを対象として,学習者の入力した数式を数式の制約にしたがい操作を行える図形に変換することで誤りの可視化を行う学習支援システムを開発し,学習者に試行錯誤が行える環境を提供した.しかし,これまでの学習支援システムでは学習者に誤りの可視化を提示するまでで止まっており,図形の操作やフィードバックの確認は学習者に依存するものとなっていた.故に,学習者によっては与えられたフィードバックを確認せず,自身の解答がどのような誤りをしているのか振り返らない可能性があった.そこで本研究では,これまでの学習支援に加え,システム側に問題におけるベクトルの合成におけるベクトルの関係性のモデルとして三角形を提示することで操作を要求する学習支援を提案する.学習者は生成されたベクトルをもとに三角形を形成する活動を必ず行うことになるため,自身の解答がどのような誤りをしているのかを振り返り,主体的な試行錯誤を行うことができる.本稿では,提案した学習支援をシステムに実装したものについて解説する.

  • 西田 啓一
    セッションID: 2R4-OS-12-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    ニューラルネットワークへの入力データに対して加えられた敵対的な摂動(敵対的データ、Adversarial Examples)の検出技術として、メトリックベースアプローチ、デノイザーアプローチ、予測不整合ベースアプローチ、ネットワーク不変量チェックアプローチなどが提案されている。本発表では、それらのアプローチのなかで最も高い検出率が報告されているネットワーク不変量チェックアプローチ(NIC法)の実用化に向けた実装法について説明し、実際に高い検出率で敵対的な摂動を検出できたことを報告する。また、NIC法が高い検出率を示す理由について考察した結果についても報告する。

  • 関根 理敏, 新原 敦介, 明神 智之, 今谷 恵理
    セッションID: 2R4-OS-12-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    AIソフトウェアは従来のソフトウェアとは異なり,学習データから帰納的に開発されるため,高品質なデータセットを用意することが重要である.これまで我々は,複数の観点での潜在変数を抽出可能な変分オートエンコーダを利用して,潜在変数及び対応するデータの可視化により,データセットの多様な属性情報を取得可能な品質評価手法を提案している.そこでは潜在変数と属性の対応付けをユーザが手動で実施するため,手間がかかり属性値の定量化が困難という問題があった.そこで本稿ではその変分オートエンコーダを改良して,潜在変数から属性値を自動かつ定量的に予測可能な半教師あり表現学習手法を提案する.提案手法ではデータセットの一部に含まれる教師データの潜在変数から属性値を回帰予測できるように,損失関数に回帰式の適合度の指標である決定係数を含む項を追加し,決定係数が高くなるように学習する.帳票の手書き文字データセットに本手法を適用した結果,文字の太さや画数を予測可能な潜在変数を生成し,データセットの属性値別の出現頻度を把握してデータセットの客観的な品質評価に有効であることが分かった.

  • 宮城 優里, 大西 正輝
    セッションID: 2R4-OS-12-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本発表では機械学習モデルの品質評価支援を目的として,作成したモデルの特徴とその調整作業の過程を可視化する手法を提案する.近年,学習データの性質やモデルの構造,出力といったモデル自体の情報を対象とする可視化手法は多数発表されている.その一方で,モデルの作業者(アノテータ,設計者,エンドユーザ)に関する情報を可視化する手法は少ない.モデル作成過程での作業者の積極的な介入(Human in the loop)はモデルの精度向上に有効であると認められており,作業者の情報を含む可視化はモデルの性質の詳細な理解,調整内容の評価,有効な改善策の提示などに有用であると考えられる.そこで我々は,作業者に関する情報としてモデルの変更履歴や,個々の調整作業の目的の可視化に焦点を当てた可視化ツールの設計を進めた.モデルの調整過程でデータ,モデル構造,最適化アルゴリズムにどの程度の差分が生じたのかを計算し,変更の意図(総合的な精度向上,既存手法の再現など)と合わせて可視化する.実行例として機械学習の実験管理ツールであるComet.mlを用いて画像分類用のモデルを学習・テストした際の履歴の可視化結果を紹介する.

  • 磯部 祥尚
    セッションID: 2R4-OS-12-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    現在、深層学習を用いたニューラルネットワークに代表される機械学習モデルの評価には、データセットに対する評価指標(正解率、適合率、再現率など)が広く利用されているが、このような評価指標ではデータセットに含まれない未知のデータに対する性能を保証することは難しい。本発表では、データセット以外のデータに対しても確率的に性能(不正解率)を保証するために、統計的学習理論に基づくノイズ付加汎化誤差上界を評価指標として利用する方法を説明し、その有効性を実証するための実験結果について報告する。ここで、汎化誤差とは、対象とする(ある確率分布に従う)全ての入力データに対する機械学習モデルの出力の不正解率の期待値である。一般に入力データは無数にあるため、汎化誤差を正確に計算することは困難であるが、その上界に関する多数の既存研究がある。本研究では、よく知られている訓練誤差ベースの汎化誤差上界(PAC-Bayesian bounds)の定理をテスト誤差ベースとして適用し、タイトな(汎化誤差と上界の差が小さい)汎化誤差上界を計算している。

  • 大川 佳寛, 金月 寛彰, 小林 健一
    セッションID: 2R4-OS-12-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    機械学習技術を用いた AI システムの運用においては,運用時のデータの変化により,システムの品質や性能が低下する恐れがある.特に,コンセプトドリフトと呼ばれるデータ分布の変化は,システムの性能低下を引き起こす主な原因の 1 つである.加えて今後のAIシステムの運用においては,データのプライバシーやセキュリティの問題で運用前に使用した訓練データを再利用できない場合や,システムの適用先が多岐に渡ることが想定される.そこで本稿では,著者らが直近の人工知能学会全国大会 (JSAI2020, JSAI2021, JSAI2022) において紹介した,コンセプトドリフト検知・適応技術や,教師なしドメイン適応技術について整理し,これらの技術が運用時の品質や性能維持に対して有効であることを示す.さらに本稿では,データプライバシーの保持などのAI 運用の新たな課題解決に有効な技術として,運用時に運用前の訓練データを用いずにオンラインで機械学習モデルを適応させる「Test-time 適応手法」の最新研究を紹介し,同適応手法の適用タスクが拡大していることを示す.

  • 田中 彰吾
    セッションID: 2R5-OS-28a-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    岡潔は、良寛の書に接した経験を例に、ものごとの「わかり方」を三局面に区別し、「信解」「情解」「知解」という概念で説明している。(1)「信解」は「何がどうわかったのかわからないが、一切がわかってしまった」という主客未分の悟りのような直観が生じる局面、(2)「情解」は一定の情動とともに、対象に関わる心の作用が整理されていく局面、(3)「知解」は、前段で生じた整理が、対象を知覚する経験、それを言葉にする経験によってさらに整理される局面、をそれぞれ指していると考えられる。 ひとが世界や対象に出会う際、主客未分の「一切がわかってしまった」という経験は生じる場合もそうでない場合もあるので置くとして、本発表で問題にしたいのは「情解」と「知解」の関係である。通常の経験において、「情解」と「知解」は常に生じているように見えるし、両者には時間的な順序があるのではなく、同時並行で生じているように見える。ここでは、情動の身体的感受説(信原 2017)やメルロ゠ポンティの身体図式論を手掛かりに、情動と知覚、経験の価値的側面と事実的側面、経験とそれを語る言葉との関係について、改めて論点を整理してみたい。

  • 知情意一体となった身体知のありようを目指して
    堀内 隆仁, 諏訪 正樹
    セッションID: 2R5-OS-28a-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    「身体運動像である」と私たちがみなす知覚像は、本来はそう認識されるより先にまず、「身動き」として感得されるべきものだ。身動きとは、動く身体が醸し出す「表情」のことである。表情とは、<知情意>一体となったゲシュタルトのことであり、私たちに生きられる環界は表情に満ち充ちていると廣松渉(1989)は説く。流れる小川はサラサラとしか言いようのない「爽やかな感情を纏った何か」として、引き金は「引こうという意図・意志がむき出された何か」としてまず立ち現れる。私たちは研究者であれアスリートなど実践者であれ、つい身動きをスルーして、客観(<知>)vs主観(<情><意>)という構図から出発し、身体の知のありようを捉え損ねてしまう。著者らは現在、身動き感得を促すアプリを制作している。ある身体運動について、そこに成り立つ物的関係性をもとに、元の運動を変形した特殊な身体運動映像が、それを見るユーザに、身動きを立ち現れさせ得ると考える。身動きとしての新しい(運動の)分類体系が得られる可能性もある。

  • 川嶋 稔夫
    セッションID: 2R5-OS-28a-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    文化財のディジタル化に携わるなかで,撮影依頼された資料の画像確認作業中に特定の部分が気になり出すことがある.その関心は長期間続く.岡潔のいう「捜し求めるというより,そこにひたすら関心を集め続ける」ことに近いことかもしれない.関心は,潜在する知の発見にもつながっているようにも思われる.本稿では,著者の作業経験を振り返り,分析を試みる.

  • 文明と共進化する意識について
    下西 風澄
    セッションID: 2R5-OS-28a-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    近年の認知科学を巡る哲学研究の潮流は、意識の身体性や環境との相互作用に着目している。神経生物学者のフランシスコ・ヴァレラはこうした認知哲学を「身体化された心」と呼び、認知が単なる記号的な情報処理として普遍的に機能するのではなく、それぞれの個別の歴史性を有した身体や、その有機体が行為する状況に深く依存してはじめて捉えることができるという観点に注目した。こうした認知の身体性を広く解釈すれば、認知とは、それを行う認知主体の身体的な習慣、使用する言語、活動する生態環境などの総合的な環境のなかで捉えるべき対象となる。別の言い方をすれば、意識はいわば「文明と共進化」する視座のなかから理解すべき現象でもある。 筆者は『生成と消滅の精神史』(文藝春秋、2022)にて、この「文明と共進化する意識」という観点から、古代・近世・現代の西洋における意識、夏目漱石の文学において描かれた意識を対象に論じたが、本発表では、漱石の作品における意識の描かれ方とその理論における捉え方を比較し、日本における意識の捉え方を考察する。

  • 藤井 晴行
    セッションID: 2R5-OS-28a-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    デザインという人工のものごとや知を創造する行為に関わる知能研究の方法の規範的なありたい姿を描くことを目的とする。 デザインすることの原点は生きるために自覚的に工夫することである。デザインにおける認知過程を、構成的方法論の実体的側面、概念的側面に生体的側面を加えた三側面から捉え、岡潔が紹介する知・情・意および生・命・悟と関連づけて、知能研究の方法について考察する。特に、岡潔の世界観に関わる言明、「人間は物質的自然の中に住んでいるのではなく、心の中に住んでいる」、「東洋人の見ている自然は生きた自然である」、「生命現象は五感でわかる範囲内にはない」、「情的にわかっているものごとが知的にわかることが発見である」などに注目する。この世界観は知能研究が基本とすべき世界観であると考えている。

  • 中西 泰人
    セッションID: 2R6-OS-28b-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    自動運転車やロボットやAIなどの機械知能が私たちの身の回りに存在する未来はすぐそこに来ている。その知能や能力がシンプルで限定的だとしてもそれがある量を越えて風景の一部となった時、私たちはどのような環境にいるのだろうか。パーソナルコンピュータやインターネットが世界に広まろうとする時、新しい道具と環境が人類のどのような知性を引き出すのか?といったことが多く議論された。他者として存在する機械知能に囲まれた環境はどのようにデザインされ、その中でどのような知性が引出されていくのか。そうした問いを立てるにあたり、人類とは異なる知性の象徴としての菌類と人類を超越した知性としてのブッダの知性を参照しながら様々な分野の方々にインタビューを行う「スマートシティとキノコとブッダ」と名付けたプロジェクトを進めている。本稿ではそこで語られている内容に、岡潔の「数学する人生」で述べられた知のあり方としての俳句と阿頼耶識を合わせて参照することで、意識的な思考・合理的な思考の象徴としての近代都市から逸脱した新たな世界の描き方の一つを構想する。

  • 三宅 陽一郎
    セッションID: 2R6-OS-28b-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    知能は情報だけではなく、身体内部の活動や環境のダイナミクスから受ける作用の集合を基盤として、階層的にかつ動的に校正される。認識は、まず対象が世界を背景に浮かび上がり、徐々に刺激した身体の諸欲求と紐づいていき最後に消滅する。このような認知ダイナミクスによって、知能は自己と世界のモデルを同時に再構成し、その関係を構築する。その関係性が知能を駆動するトリガーとなる。本セッションではエージェントアーキテクチャの中心を通る統合フロー(情報の流れ、作用の流れなど、内部からの流れなどを統合した全体の流れ)がいかに認知を形成し、認知の時系列の流れを情として上位に形成し、最後に意志となるかについて述べる。

  • 暗黙性、状況依存性、シンボルグラウンディングへの挑戦
    諏訪 正樹
    セッションID: 2R6-OS-28b-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    学問や研究はとかく科学的に為す(客観性・普遍性を有す)べしという観念が近年ますます強まっているように映るが、その思想だけは知の研究はもはや立ち行かない。自身が有する知へのアクセスは暗黙性によって遮られる。外界状況のなかに塗れて発揮される状況依存的なスキルや知恵は、科学的なお作法で捉えることは難しい。岡潔のいう「生」や「悟」に対する眼差しがいま知の学問に求められている。 そもそも学問や研究はこれこれこういう方法論ですすめるべきという「方法論ありき」の考え方は、研究対象の性質に向きあう態度に欠けていてあまり誉められたものではない。中谷宇吉郎氏の「定性的研究と定量的研究が往還してこそ真の意味での科学である」という説にも反する。ひとの知能は身体や生活に根差し立ち現れるものであるということを理解した上で、知能研究を進めたいものである。 本発表は、いわゆる科学的研究が捉え損ねてきた知の重要な側面にアクセスし、単なる情報処理研究を超えた、人間研究としての知の探究のありかたを議論する。

  • 田口 怜, 坂地 泰紀, 和泉 潔
    セッションID: 2T1-GS-10-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究では、金融テキストが株式の戦術的アセットアロケーションに有用であるかどうかを実証する。これは、自然言語処理を用いて金融ニュースから極性指標を作成することで実現できる。作成された極性指標に対して、変化点検知アルゴリズムを用いてクラスタリングを行う。さらに、株式ポートフォリオを構築し、最適化アルゴリズムを用いて各変化点でリバランスを行う。その結果、提案手法は、比較手法を上回る性能を示した。この結果は、極性指標が株式アセットアロケーションの構築に有用であることを示唆している。

  • 末吉 璃子, 有田 正剛
    セッションID: 2T1-GS-10-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    近年、機械学習の発展に伴い深層強化学習を最適化問題へ応用する研究が増えている。その中で本研究では、強化学習(Actor-Critic)とPointer networkを用いて、暗号に用いられるKnapsack問題を解く事を目標とし、強化学習(Actor-Critic)とPointer networkをTSPを解く事に応用したGoogle Brainの研究を元にKnapsack暗号のトラップドア(Knapsack問題)を解く為の手法を提案する。具体的には、ランダムと超増加性及びモジュロ超増加性トラップドアを問題とし、厳密解を求め、LLLアルゴリズムとの比較も行った。結果は、いずれの問題も30次元まで解く事が出来、問題によってはLLLアルゴリズムよりも精度が良かったが、基本的に高次元低密度ではLLLアルゴリズムの方が良い結果となった。

  • 津熊 哲朗, 沖 拓弥
    セッションID: 2T1-GS-10-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    特許文献は、請求の範囲、詳細な説明、図面の3つの構成からなる。特許審査では、分類記号と文章を用いてデータベースを検索し、請求の範囲に既存の文献が含まれるかを調査する。しかし、不動産間取りについては分類がなく、効率的な調査が困難であった。そこで本論文では、表記ゆれのある特許図面を構造化グラフとして扱い、審査での間取り図検索を効率化する手法の構築を目的とする。まず、特許図面の各画素に部屋種別のラベル付けを行う。そして、ルールベースで部屋の接続関係を規定し、ラベリング済みの特許図面をグラフに変換した。次に,グラフ類似度として最大共通部分グラフに基づく類似度を採用し、エッジ数の多いノードとその周囲を優先的に探索することで、計算時間を大幅に短縮した。また、請求の範囲の文章内の部屋種別を形態素解析で抽出し、これをエッジの特定や類似度に反映することで、審査実務をふまえた検索を可能とした。最後に、実際の審査文献を用いた検証の結果、審査での引用文献が類似度の上位10%以内で発見され、提案手法の有用性を確認できた。

  • 石坂 敢也, 加茂 碧唯
    セッションID: 2T1-GS-10-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    小売業において,商品管理や棚割り作業の効率化のために,商品棚にある商品をAIで特定したいというニーズが高まっている.商品棚から物体検出された個々の商品画像をデータベース画像と照合し特定する画像照合技術には,店舗毎に異なる照明環境や陳列状態下において,類似デザインを含む数百~数千商品を峻別できること,また頻繁な商品デザイン変更に追随できることが求められる.更に,通常は商品毎に学習に使える画像枚数も限られる.このような課題に対して有効なアプローチとして深層距離学習があり,本研究では,one-shot画像からのデータ拡張,クラスタワイズ引力/斥力機構,エポック毎pairwise semi-hard negativeマイニング,バックボーンCNNでのself-attention機構の活用,などを導入し性能獲得を図った.Recall@5性能は学習済みカテゴリで約97%,未学習カテゴリで約95%を達成した.距離学習の特性により,誤照合の修正作業も効率化が可能である.

  • 米田 智紀, 大塚 玲
    セッションID: 2T1-GS-10-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    ペネトレーションテストは機器やシステムに対して様々な技術を駆使して侵入を試みることで,対象のセキュリティ上の脆弱性を検査する手法である.ペネトレーションテスターはシステムレスポンスを基に必要となるコマンドを選び,実行している.この動きはTextWorldといったテキストベースゲームを攻略する手順と類似性がある.そこで,本研究では,Textworldを部分観測マルコフ決定過程 (POMDP) に 基づく深層強化学習で,効率的にゴールを見いだすニューラルエージェントに着目し,そのシステムをベースとしたペネトレーションテスト手法を提案する.また,既存のニューラルエージェントはGRUをベースとして作られているが,本提案手法では,ニューラルエージェントの状態推定を行うモデルに注意機構を内部に持つ GTrXLを導入したシステムを提案する.これらシステムをLinux 等の OS 環境に作用させ, Exploit コマンドを行動集合に持たせ実験を行い,従来のモデルに対する優位性を示すことに成功した.

  • 村井 伸一郎, 岩崎 敦
    セッションID: 2T4-GS-5-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究では,繰り返し囚人のジレンマにおいて,プレイヤが行動を取り違えるとき,無限集団上のダイナミクスのもとでどんな戦略が生き残るかを吟味した.従来よく使われる戦略表現でである一期記憶戦略では,有名なトリガー戦略,一度でも裏切りを観測したら二度と協力しない,を正しく表現できない.つまり,裏切りを観測したあとに2人が同時に行動を取り違えると,協力に戻ってしまう.そこで,状態数2以下の有限状態機械からなる戦略空間上に突然変異付きレプリケータダイナミクスを構築し,その帰結を吟味した.その結果,プレイヤの行動の取り違えに対して有効に振る舞う単独裏切-相互同期 (Unilateral Defection, Bilateral Synchronization) 戦略を発見し,生存過程を明らかにした.

  • 坂本 充生, 阿部 拳之, 蟻生 開人, 岩崎 敦
    セッションID: 2T4-GS-5-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究では,二人零和展開型ゲームにおける突然変異を利用した乗算型重み更新の帰結を吟味する. 二人零和展開型ゲームは不完全情報下の意思決定における重要な問題である. このゲームの均衡は線形計画法で求められるが,ポーカーなど大きなサイズのゲームを扱うことは難しい. この問題に対して,均衡戦略を近似する学習アルゴリズムが提案されている. しかし,既存アルゴリズムの多くは学習のダイナミクスの時間平均をとって初めて均衡に収束する. 一方,標準形ゲームでは,突然変異の導入によって時間平均を取らずに均衡戦略を学習できることが明らかになっている. そこで本研究では展開型ゲームにおいて突然変異を加えたDilated Mutant Multiplicative Weight Updateを提案する.シークエンス型で戦略を表現し,突然変異の付きの乗算型重み更新でその戦略を更新する. 実験の結果,提案手法が複数のゲームおいて時間平均を取らずに均衡戦略を学習することがわかった.

  • 山田 博瑛, 小宮山 純平, 阿部 拳之, 岩﨑 敦
    セッションID: 2T4-GS-5-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究では,オンライン環境において公平な資源配分を実現するアルゴリズムを扱う.オンライン環境とは,災害時の避難所にどんな物資が届けられるかや,工場の勤務シフトを作成する際にどんな注文がやってくるかが,事前にはわからない状況を指す.資源配分における公平性には様々な概念があるが,本研究では参加者全員の効用の積であるナッシュ積を最大化することを目的とし,オンライン環境におけるフィッシャー市場の均衡解を求めるアルゴリズムを提案する.とくに,届けられる資源の価値が事前にはわからない環境で,アルゴリズムが事後的な最適解を漸近的に達成することを確認する.

  • 黄 健明, 笠井 裕之
    セッションID: 2T4-GS-5-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    最適輸送(OT)理論を用いることで,既知の測度空間における異なる確率分布間の違いをWasserstein距離で比較することが可能となるが,その計算複雑度はO(n^3)であり実問題への適用は難しい.Sinkhornアルゴリズムは,エントロピー正則化によりその複雑度をO(n^2)に抑え,GPU並列化処理もサポート可能とする.しかしながら,サイズが異なる確率分布に対しは,GPU並列化処理はがほぼ不可能となる.そこで本稿では,最適輸送問題から変換した新たな部分空間最適輸送(SOT)問題を提案する.SOT問題では,輸送される分布のサイズが固定されておるため,元分布のサイズが異なってもGPU並列化処理が可能となる.さらに,OT問題を提案SOT問題に変換するための等価条件について提案し,本等価条件に基づき,深層辞書学習によりOT問題から近似等価のSOT問題に変換する手法を提案した.実験結果により,提案手法は近似誤差を低減可能であるとともに,計算時間を大幅に削減することが可能であることを確認した.

  • 松井 俊浩
    セッションID: 2T4-GS-5-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    複数エージェント集配問題は,倉庫内の自動搬送ロボットや自動操車を動機付けとして研究されている. 基礎的な解法として,タスクの経路の端点の競合を解決し経路のデッドロックを回避する手法が用いられる. この手法を効率化するための発見的手法が複数提案されているが,それらを統合して活用する場合については検討の余地があると考えられる. 本研究はこれらの効率化手法を統合する効果および他の解法との対比につながる知見の把握を将来的な目標とし,初期検討として,スペース利用と経路の冗長性を削減する二つの効率化手法を統合する. 実験結果により提案手法の効果を示し,その分析から端点の競合解決に基づく効率化手法の一般化の可能性を考察する.

  • 人間らしく振る舞うためのデザインパターン
    安藤 颯汰, 三宅 陽一郎
    セッションID: 2T5-GS-5-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究は, 3DアクションゲームにおけるキャラクターAIのデザインパターンについての提案である. 現在まで,デジタルゲームにおけるキャラクターAIの開発には決まった手法が存在しない.そこで,本研究ではキャラクターAIの開発手法として,パターンランゲージを用いる手法を提案する.本手法は「ゲームからキャラクターの行動を抽出」,「パターンランゲージを作成」,「パターンランゲージを実装」,「パターンランゲージの検証」の4つのプロセスからなる.大型商業ゲーム数作からユーザーが違和感を持つキャラクターの行動を抽出し,この抽出された行動をもとにキャラクターAIが遵守すべき20の規範となるキャラクターAIデザインパターンのリストを作成した.次に, この規範リストをもとにゲームエンジン(Unreal Engine5)上で1つの規範ごとに, 規範を遵守する場合と遵守しない場合の行動パターンを実装し比較を行なった. 本稿では,このキャラクターAIデザインパターンのリストのうち4つのデザインパターンの実装について解説し,その有効性を示した.

  • 岩田 健太郎, 浅賀 潤一, 阿部 健太, 宇田川 杜和, 越知 淳司, 松井 実, 村越 英樹, 林 久志
    セッションID: 2T5-GS-5-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    早期離職率は過去30年間,30%前後で推移している.その主な理由は会社内の人間関係の不和である.我々が調べた限りではフォーマルな人間関係とインフォーマルな人間関係の両方から早期離職を考察した先行研究はない. 本論文の目的は,この両方の人間関係を考慮して早期離職を防ぐ会社の組織構造を提案することである.我々は,フォーマルな関係とインフォーマルな関係から早期離職者を推論するシミュレーションモデルを構築した.このモデルに基づいて,既存社員の若手メンバーで一つのチームを形成し,新入社員をそのチームに配属する会社の組織構造を提案する.シミュレーションの結果,提案した構造は既存のトップダウンの企業構造よりも早期離職の抑制に有効であることが示された.

  • 竹内 優, 長谷部 浩二
    セッションID: 2T5-GS-5-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    間接互恵性は社会における協力の創発のメカニズムの一つである。これは見知らぬ者からの協力を説明するメカニズムであり、過去の協力行動が良い評判という形で第三者に伝達されることで成立すると考えられる。しかし、実社会では協力の動機となり得る他の要因が存在する可能性がある。本研究では豊かさの指標として所得を考え、所得に関する情報が協力の創発に与える影響を分析する。そのために、所得に関する情報に基づき繰り返し囚人のジレンマを行うモデルを与える。このモデルを用いたシミュレーションにより、ゲームにおける協力行動の選択の割合を評価した。 シミュレーションの結果、本実験の設定においては、所得に関する情報を与えた場合において協力の創発は観測できなかった。

  • 奥原 俊, 伊藤 孝行
    セッションID: 2T5-GS-5-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    テレビ会議では,エージェントが介入することで人々の意見がどのように変化するのか,その方法を確立することが困難である.特に、どのような介入方法が人々の意見の変化をもたらしたかを理解することは重要な研究課題である。本研究では、テレビ会議におけるエージェントの議論に介入した場合の効果を調べる。そのために、まず、他人と反対の意見を表明するエージェントを実装し、その効果を検証する。実験は、14人の被験者を、エージェントがいないグループ(以下、エージェント介入なしグループ)とエージェントがいるグループ(以下、エージェント介入ありグループ)に分けて行われた。エージェントの介入により意見の変化が見られたものの、統計学に基づく仮説検証の結果、介入の効果は明らかになりませんでした。しかし、今回の調査は母数が少ないため、統計学に基づく仮説の検証をより適切に行う必要がある。そのため、今後の課題として、多くの参加者を得て、さらなる実験を行う必要がある。

  • 金澤 聖也, 片上 大輔, 宮本 友樹
    セッションID: 2T5-GS-5-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    将棋で次の一手を決めるには,複数の着手可能な手から候補手を絞り,手を読み進めていき,読み進めた先の局面同士を比較し,より良い局面であると判断した手を指す必要がある.一般的に将棋は着手可能な手が多く,将棋初心者はどの手を検討していけば良いか分からない.そこで既存の将棋AIを利用した将棋のアシストとして,ユーザに候補手の提示をするアシストが行われている.候補手の提示というのは「2八の飛車を6八のマスへ動かす」のような具体的な手の提示である.しかし,候補手の提示を行ったアシストでは,ユーザは今後の展開を読み進めず,ただ提示された手を指すといった思考の放棄を促してしまう可能性がある.過剰な支援が与えられることで学習者が自己学習能力を発揮しなくなり,学習効果が減少することは「アシスタンスジレンマ」と呼ばれている.そこで本研究では,「2八の飛車を動かす」といった動かした方が良い駒のみを複数提示し,各駒をどこへ動かすかは提示しないシステムを提案する.実験により,既存のアシストと比較し,思考を促し,アシスタンスジレンマを解消する可能性を調査したので,その結果を報告する.

  • 若狭 成宗, 曽我 真人
    セッションID: 2T6-GS-9-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究ではMR環境における より効率的な文字入力方法を創出することを目的とした.この目的を達成するためのアプローチとしてハンドトラッキング,ジェスチャ入力,3次元キーボード,直接キーボードを触ることで入力する形式の4つを組み合わせたシステムを検証した.ユーザーによる検証の結果、SUS評価に関しては概ね良かったものの、誤入力や入力難度の高さなどが課題として浮き彫りになった.

  • 大神 健司, 飛田 博章
    セッションID: 2T6-GS-9-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    自分でメニューを考え料理する自炊は,好きなものを選びがちな外食に比べ,健康を維持するために効果的である.しかし,料理初心者にはレシピの再現自体が難しく,レシピに記されている調理行動を再現できないため,味や見た目がレシピと大きく異なる結果となる.この課題の解決策として,料理初心者の行動に対し,次の調理工程の指示や,指示と異なる行動をした場合にそれを正すためのフィードバックの実現が重要となる.本研究では,調理者の行動を認識し,適切にフィードバックする仕組みの実現に必要となる,実時間での調理行動認識手法について述べる.提案手法では,実際の調理で両手首にウェアラブル型の加速度センサを装着し,加速度と角速度のデータを取得する.取得したデータに対し,調理行動を 7 クラス(手を洗う,皮を剥く,切る,みじん切りにする,炒める,混ぜる,その他)にラベル付けし,畳み込み LSTM で学習・分類する.バッチ推論で学習済モデルの性能を評価した結果,再現率のマクロ平均が 86.39%であった.また,実際にカレーを調理しながら実時間推論で提案手法の性能を評価した結果,同マクロ平均が 61.32%であった.

  • 塚本 幸太郎, 柿木 太志, 飛田 博章
    セッションID: 2T6-GS-9-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    料理において、各調理工程を的確に行うことと調理工程全般を俯瞰的に見ることの両方が料理上達の上で重要となる。しかし、料理のレシピの多くがテキストと画像を用いて表現されているため、初心者にとって全体の手順を俯瞰して把握することが困難となっている。 本稿では、調理に使用するレシピをフローチャート形式に変換して表示するWebアプリケーションについて述べる。Webアプリケーションはシングルページアプリケーションとして実現され、フローチャートと調理画像から構成される。フローチャートは全体の手順が簡潔な形式で表現され、現在の調理工程の進捗状況や次の作業内容を一目で把握することができる。提案システムでは、レシピのテキスト解析から調理動作の各ステップを切り出したのち、仮定表現や終了条件は判断を表すひし形、通常の調理工程は長方形を使い自動的にフローチャートの描画が行われる。例えば、ミネストローネを作る工程はひし形が4個、長方形が8個で表現される。実装したシステムを利用し、レシピサイトから取得した簡単なレシピを入力したところ、適切なフローチャートが描画されていることを確認した。

  • 原田 理央, 角 薫
    セッションID: 2T6-GS-9-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究ではペット型ロボットが人を説得するための表現方法について調査する.ロボットが人を説得するためにロボットが何らかのアクションをすることを試みる研究がある.いくつかの動作と感情を組み合わせた説得するための表現を作成した.動作はペット型ロボットの動作を「呼びかけ」「誘導」「ポインティング」の3つの意味に分類した.分類した動作からいくつかの動作を選定し,それらを組み合わせた動作パターンを作成し,感情は顔や尻尾などの各部位,音声,動きの速さなどを組み合わせた感情パターンを6つ作成した.実空間でMRを用いてロボットを表示させることにより動作と感情を組み合わせた12パターンを比較した実験を行うことにより,説得をするための表現方法の評価を行った.

  • 佐藤 優介, 角 薫
    セッションID: 2T6-GS-9-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    ゲームプレイヤーの腕前には個人差があるため,万人に満足してもらえるような難易度設定は難しく,不適当な難易度はゲームプレイヤーにとってストレスとなり,ゲームからの離脱を招く恐れがある.コンピュータがゲームプレイヤーのプレイ状況を分析し,適当な難易度に調整する動的難易度調整が注目されている.本研究では,生体センサを用いて,リアルタイムに情動の変化を推定し,リアルタイムに情動の変化を推定し,情動に合わせてゲームの難易度を自動的に調整することのできるゲームを開発した.皮膚電気活動や心拍数などの生体情報を用いて,ゲームプレイヤーのゲームプレイ中の不安や退屈といった情動を推定する際の指標になり得る生体情報を検討し,生体情報から情動を推定して動的難易度調整のパターンを比較し検証を行った.実験によって得られた結果から,ゲームシーンや難易度によって発現しやすい情動が異なることが明らかとなった.

  • 石原 芳樹, 角 薫
    セッションID: 2T6-GS-9-06
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    本研究では,球体ディスプレイに3Dモデルの人物を写しだし遠隔からその人になりきってコミュニケーションを行うことのできるシステムを開発した.球体ディスプレイに映し出す人は実在の人物の3Dモデルであり,遠隔からアクセスする人はHTC VIVE pro Eyeを用いて表情と言葉でコミュニケーションができ,360°カメラにより球体の周囲の様子を見ることができる.本システムの評価として複数の被験者と球体ディスプレイ上のアバターでコミュニケーションをしてもらい,演じる側と会話する側の双方の印象について評価した.

  • Ahmed SALEM, Kaoru SUMI
    セッションID: 2U1-IS-1b-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Emotional contagion is the exchange and transfer of emotions to others. Dyadic dynamics in a group setting received little attention, especially when combined with emotional contagion as the contagion of emotions is very low due to the low number of group members (i.e., 2). In this paper, we perform a preliminary experiment by using EDA and ECG sensors to monitor 2 subjects while they are interacting with each other. We choose the subjects to be a married couple in order to ensure strong emotional contagion, thus, interesting insights can be obtained. Subjects answer the Emotional Contagion Scale (ECS) questionnaire, Facial Expressiveness Scale (FES) questionnaire, and General Health Questionnaire (GHQ-12). Our results show that the subject with a high score of FES is easily and mostly aroused, thus leading the emotions of the other subject. The emotional contagion phenomenon is clearly shown in the ECG measurements too. ECG of the subject with high FES leads/precedes the other subject, thus changes (in the form of replications) can be seen almost instantly. However, changes take longer when its related to EDA measurements. Emotions transmit from the charismatic personality to the empathetic personality, thus empathetic personality's ECG and EDA sensory information are imitating the charismatic personality's sensory information after a certain delay.

  • Anirudh Reddy KONDAPALLY, Kentaro YAMADA, Hitomi YANAKA
    セッションID: 2U1-IS-1b-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    The advent of deep learning models has made considerable strides in tasks related to navigation in the real world such as object detection and path planning. It has also led to the development of a more complicated task of visual-linguistic navigation (VLN) i.e., dialogue for navigation. Among VLN variations, outdoor scenes are significantly more difficult than indoor because of the randomness inherent in an uncontrolled environment. Outdoor VLN is also said to be closer to the reasoning required in the real world. However, the datasets available for Outdoor VLN tasks have been focused mainly on judging spatial reasoning abilities. This is not enough to create systems that work in real life as there is a need for commonsense reasoning abilities i.e. social and event-based reasoning. We create a small benchmark commonsense reasoning-based dataset and evaluate the performance of state-of-the-art VLN models on it. From our findings, we show that there is a need for commonsense reasoning-based datasets.

  • Kaito INOUE, Jianming HUANG, Zhongxi FANG, Hiroyuki KASAI
    セッションID: 2U1-IS-1b-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    In recent years, Graph Neural Networks (GNNs) have demonstrated significant advances in accuracy for various graph-related tasks. However, GNNs still fail to achieve high performance in graph classification tasks. One of the primary reasons for this is that GNNs cannot learn key subgraphs that contribute to the prediction. Some research on identifying key subgraphs has been conducted within the field of Explainable AI (XAI) in graphs. Especially explanation confidence (EC) is an important evaluation method for XAI models of GNNs. In this paper, we propose a novel method for learning GNNs that incorporates Explanation Confidence (EC). We demonstrate that the proposed method performs as well as or better than conventional methods in graph classification experiments.

  • Shihori TANABE, Sabina QUADER, Ryuichi ONO, Horacio CABRAL, Kazuhiko A ...
    セッションID: 2U1-IS-1b-04
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    (1) The objective of this study is to generate artificial intelligence (AI)-based models to predict the activation state of the molecular pathway networks. (2) Since the activity of the epithelial-mesenchymal transition (EMT) is involved in anti-cancer drug resistance and cancer stem cells, we used AI modeling to identify the cancer-related activity of the EMT-related pathway in datasets of gene expression. Molecular network pathway analyses were performed on the gene expression data of diffuse- and intestinal-type gastric cancer. A dataset of 50 activated and 50 inactivated pathway images of EMT regulation by growth factors pathway was modeled by the DataRobot Automated Machine Learning platform. The AI application created a Light Gradient Boosted Trees Regressor model to predict the activation state of the EMT pathway. The model was validated with 10 additional activated and 10 additional inactivated pathway images. Our approach holds promise for modeling and simulating cellular phenotype transition.

  • Theo Jean PONCELET, Tomoyuki MAEKAWA, Michita IMAI
    セッションID: 2U1-IS-1b-05
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    While the world of bridging anaphora resolution (BAR) is ruled by the multi-task algorithms, they are used to only perform BAR and not coreference resolution (CR). Furthermore, their pipelines are very demanding in terms of computational and spatial resources. We therefore propose to use the work of Dobrovolskii (2021) on CR and Yu and Poesio (2020) on multi-task BAR to create a multi-task and efficient algorithm that will be able to resolve both BAR and CR at the same time. We also demonstrate that, on top of its efficiency, the results of our algorithm are still competitive both in BAR and in CR with recent works.

  • We show how using staple techniques such as NN or GPR as building blocks of a more involved method can enhance ML capabilities in high dimension and or with sparse data
    Sergei MANZHOS, Shunsaku TSUDA, Hyojae LEE, Manabu IHARA
    セッションID: 2U4-IS-2c-01
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Machine learning (ML) techniques such as neural networks (NN) and Gaussian process regressions (GPR) are now widely used in diverse applications. While each technique has pros and cons, they are all challenged when faced with high dimensionality of the feature space or low and uneven data density. We will demonstrate how combining them with high-dimensional model representations (HDMR) results in methods better apt to deal with these issues. HDMR-NN, HDMR-GPR combinations and NN with HDMR-GPR neuron activation functions will be presented with examples ranging from computational chemistry to quantitative finance.

  • JINGJING BAI, Yoshinobu KAWAHARA
    セッションID: 2U4-IS-2c-02
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Visual explanation methods, such as CAM and Grad-CAM, have been proposed to visualize and interpret the decision-making of CNNs. Recently, there are some other works that not only aim to provide better visual explanations, but also to improve the performance of CNNs by using visual explanations. In this work, we propose a network architecture — MANet that generates visual explanation during the inference process using a mixed attention module for adaptive feature refinement and also uses the generated attention map to improve network performance on image recognition tasks. Experimental results show that our proposed MANet achieves better visual performance and outperforms the baseline models on both image classification and object detection tasks.

  • Yusong WANG, Dongyuan LI, Jialun SHEN, Kotaro FUNAKOSHI, Manabu OKUMUR ...
    セッションID: 2U4-IS-2c-03
    発行日: 2023年
    公開日: 2023/07/10
    会議録・要旨集 フリー

    Multi-modal personality traits recognition methods recognize human personality traits to improve the quality of human-computer interaction, which has attracted increasing attention in recent years. However, current methods fail to remove noise and cannot align different modality features in the feature fusion process. To solve the above problems, we propose an emotion guided multi-modal fusion framework for personality traits recognition. Inspired by the close relationship between emotion and personality, we design a novel emotion-guided multi-modal fusion mechanism, which is expected to enhance emotion-related features by emotion-level alignment and pay less attention to irrelevant features to remove noise. Extensive experiments show the effectiveness and robustness of our model.

feedback
Top