-
Shihori TANABE, Sabina QUADER, Ryuichi ONO, Horacio CABRAL, Kazuhiko A ...
セッションID: 4Q3-IS-2d-03
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
(1) The aim of this study is to develop artificial intelligence (AI)-based models for predicting the activation state of coronavirus molecular pathway networks. (2) Previously, we developed AI-based models to predict the activation state of epithelial-mesenchymal transition (EMT) in cancer. In this current study, a dataset comprising 50 activated and 50 inactivated pathway images for the coronavirus pathogenesis pathway, along with 50 activated and 50 inactivated pathway images for the coronavirus replication pathway, were utilized to train models using the DataRobot Automated Machine Learning platform. The AI application produced an Elastic-Net Classifier (L2 / Binomial Deviance) for the coronavirus pathogenesis pathway and an Elastic-Net Classifier (mixing alpha=0.5 / Binomial Deviance) for the coronavirus replication pathway. To validate the models, 10 additional activated and 10 additional inactivated pathway images were used. The models successfully predicted the activation state of the molecular pathway networks.
抄録全体を表示
-
YUAN YAWEN
セッションID: 4Q3-IS-2d-04
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
Arrhythmia refers to an abnormal rhythm of heartbeat; heart may beat too fast, too slow, or with an irregular rhythm. In medicine, the electrocardiogram (ECG) is prevalently used for detecting and classifying arrhythmias. In this paper, we present an approach based on the combination of Convolutional Neural Networks (CNNs), Bidirectional Long Short-Term Memory (BiLSTM) networks and Attention Mechanism for the classification of heartbeats, which can accurately classify five different types of arrhythmias. We evaluated the proposed method on the PhysioNet MIT-BIH dataset. According to the results, our method was evaluated using 10-fold cross-validation, achieving the accuracy of 95.17% in arrhythmia classification.
抄録全体を表示
-
Ryosuke KITA, Chiduru WATANABE, Masateru OHTA, Naoki TANIMURA, Koji OK ...
セッションID: 4Q3-IS-2d-05
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
The evaluation of protein-drug molecule interactions through molecular simulation plays a critical role in identifying drug candidates from a vast pool of chemical compounds in computational drug discovery. To increase the hit rate, which has been a challenge with traditional methods, accurate quantum chemical calculations of protein-drug molecule interactions are necessary. However, evaluating protein-drug molecule interactions using conventional quantum chemistry calculation methods is challenging. The Fragment Molecular Orbital (FMO) method allows for the calculation of protein-drug molecule interactions with quantum chemistry accuracy. Still, even using the "Fugaku" supercomputer, it takes several hours per structure, indicating a need for further reduction in computational costs. This study presents a machine learning model that predicts interaction values between proteins and drug molecules using the FMO method. This model is based on a neural network and utilizes vectors of the surrounding environment of each atom in the drug molecule as explanatory variables. Using a dataset of approximately 2000 structures, the model was trained and tested for predicting interactions in unknown structures. The model successfully predicted protein-drug molecule interactions with an R2 value of 0.59.
抄録全体を表示
-
ト イッカン, 伊藤 孝行
セッションID: 4R1-OS-8a-01
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
噂や誤った情報は、誤解を招く方向を通じてソーシャルネットワーキングサービス (SNS) やオンラインのディスカッションに影響を与えるため、事実検証は重要な課題である。 一方、大規模言語モデル (LLM) の性能向上以来、LLM を使用したファクトチェックの人気が高まっている。 しかし、既存手法には次のような問題がある。 1) 単一の情報源が信頼できると想定されている。 2) 提供された情報に基づいて LLM が行った判断結果は、常に完全に信頼できるものと見なされる。 3) SNS 上のテキストは複雑であるため、バイナリの分類タスクだけでは不十分である。 そこで、複数のエージェントを実装したマルチエージェントファクトチェック(MAFC)と呼ばれるフレームワークと、テキストの信頼性を評価するための独自のメカニズムを提案する。 提案するフレームワークは、いくつかの比較実験を通じてテストされた。最後に、定義基準やデータセット作成など、ファクトチェック分野に存在する課題と障害について説明した。
抄録全体を表示
-
森原 ソフィア遥, 永合 由美子, 関口 海良, 大澤 幸生
セッションID: 4R1-OS-8a-02
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
近年,労働人口の減少を踏まえ,多様な人材を活用していくために多様性を尊重する動きがさかんである.しかし,日本では国会議員の選挙や大学入試のような競争的選抜プロセスを経た集団において多様性が低く,若者や女性が少なくなっている.本研究では,この現状が正当な評価の結果なのか,競争的選抜プロセスに参加する前の集団から排除され,機会の平等が損なわれている結果なのかを明らかにすることを目的とした.手法として,まず国会議員データを対象に競争的選抜プロセス前後の集団をモデル化した.次に各集団での属性分布の偏りをエントロピーを用いて定量化することによって,競争的選抜プロセスに参加する前の集団から排除されている可能性を検討し,不当に機会を奪われているというマイノリティ性を示す属性を発見することを試みた.結果として,選挙という競争的選抜プロセスにおいて,年齢や性別という属性については,候補者に参入する段階では排除されておらず,機会の平等が担保されていることが結論付けられた.
抄録全体を表示
-
Tianchen WANG, Sofia SAHAB, Jawad HAQBEEN, Takayuki ITO
セッションID: 4R1-OS-8a-03
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
This study investigates the potential of AI conversational agents as a support tool for Afghan women facing mental health challenges post-2021.It assesses the effectiveness of these agents in providing a safe space for sharing experiences and improving mental health and self-efficacy. In a controlled experiment, 60 Afghan women interacted for an hour with one of three AI agents: a standard GPT-4 agent (Agent A), an instructional-enhanced agent (Agent B), and an empathy-enhanced agent (Agent C). Well-being and self-efficacy were measured using the WHO-5 Well-being Index and a General Self-Efficacy scale before the experiment and at a one-week follow-up. Preliminary findings indicate that Agent C significantly improves well-being and self-efficacy compared to Agents A and B. These initial insights highlight the potential of AI conversational agents as tools for psychological support.
抄録全体を表示
-
Sofia Sahab SAHAB, Jawad HAQBEEN, Takayuki ITO
セッションID: 4R1-OS-8a-04
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
Effective communication is a fundamental human ability, often realized through discussions—a soft approach to collaboratively solve common problems. Traditional methods, such as the Issue-Based Information System (IBIS), have been employed in various support forums to manage and facilitate online discussions. However, existing facilitation policies face limitations in supporting consensus building, relying on a single policy throughout the discussion. To address this, we previously proposed a discussion timeline, introducing specific facilitation policies for each phase. Yet, our prior study did not comprehensively evaluate all facilitation policies within this timeline. In this study, we conducted a social experiment utilizing all policies in the discussion timeline to assess acceptance towards meaningful consensus building. Our goal is to determine the efficacy of IBIS element-specific facilitation policies for each phase compared to a general facilitation policy for discussions without a timeline. The paper presents the methodology, results, and implications of implementing an IBIS element-specific, AI-enabled facilitation policy in enhancing collaborative planning.
抄録全体を表示
-
松本 宇宙, 白松 俊, 岩田 崇, 水本 武志
セッションID: 4R1-OS-8a-05
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
民主主義社会では、主権者である市民による参画が必須である。しかし議論に参画することの心理的障壁が高い市民も多い。そこで本研究では参画を促進するシステムの開発を目指している。本稿では特に、大規模言語モデルを用いて再現される仮想市民とユーザが議論できる議論シミュレータを開発する。これにより議論参加の練習を可能にし、参加時の自己効力感の向上を試みる。 これまで、本議論シミュレータを用いて2023年6月と12月にワークショップを行った。しかし、6月のバージョンでは仮想市民が自身の設定に過度に固執してしまい、意見変容が全く起こらない問題があった。12月のバージョンでは、他者の意見に過度に追従してしまい、意見変容し過ぎるという問題があった。そこで本稿では、仮想市民が自身の主張も適切に保持しながら適度に他者の意見の影響も受け、適切な意見変容の可能性がある発話生成手法を試作した。具体的には、他者の意見の影響を受ける度合いを定量化し、その度合いをLLMで制御できる手法を試作した。さらに、本手法で意見を生成した際に適切な意見変容制御が可能であるかを検証した。
抄録全体を表示
-
福島県除去土壌問題を題材としたオンライン・ディスカッションの分析を踏まえて
崔 青林, 柴田 侑秀, 原 大拓, 相馬 ゆめ, 辻本 光英, 大沼 進
セッションID: 4R3-OS-8b-02
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本研究は、クラウドスケールの議論の支援技術への社会的期待と課題を提示することを目的とする。ハイパーデモクラシーの実現に向け、人工知能分野において議論の支援技術が盛んに研究されており、様々な提案や実証研究が行われている。一方で、人工知能に求められるハイパーデモクラシーの支援技術は、社会からの要請を的確に拾うことも重要であり、実証的なアプローチの継続的蓄積が求められている。本研究では、現実に要請される社会問題として福島県除去土壌問題を題材にオンライン・ディスカッション(OD)の実証実験を実施した。実証実験の観察ならびに討議データの分析を通じて、議論の支援技術の社会的期待と課題について探索的考察を試みた。具体的には、大規模合意形成支援システムを導入し、東京と大阪で2回のODを実施した。討議データの分析に際し、議論構造や討議の質指標を用いた評価など複眼的な手法を用いた。異なるアプローチを組み合わせた討議の内容・構造・質に関する複眼的分析の望ましさや、分析結果の可視化において情報のわかりやすさと正確さとのトレードオフを認識・改善すべきことについて考察した。
抄録全体を表示
-
討議の質指標(DQI)を用いた多元的共通善および影響を受ける主体への配慮に関する比較
相馬 ゆめ, 植 穗奈美, 柴田 侑秀, 辻本 光英, 崔 青林, 中澤 高師, 辰巳 智行, 有馬 淑子, 大沼 進
セッションID: 4R3-OS-8b-03
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本研究の目的は,公共的討議場面を念頭におき,そこでの議論内容に議論フレームが与える影響を明らかにすることである。公共的討議に参加する市民は多元的な共通善を満遍なく議論するとともに,影響を受ける複数の主体にも配慮することが求められる。ただし,実際に人々がそのように議論できるかは討議の場のデザインに依存する。本研究ではその一つとして議論フレームに着目した。共通善への言及や影響を受ける主体への配慮と,議論フレームの関係について検討するために,係争的なフレームと包摂的なフレームの二条件を設け,集団討議実験を行った。分析には,質問紙データと,討議の質評価指標 (DQI) を用いた。DQIは議論に参加していない第三者が,議論中の発話ごとに,評定項目の基準に該当する発言かを評価するものである。実験の結果,共通善への言及には条件間で差がみられなかった。一方,影響を受ける主体への配慮は,包摂的なフレームでは個人が支持する立場に関わらず同様に配慮がなされたが,係争的なフレームでは個人が支持する立場によって配慮される主体が異なっていた。本研究の知見は,公共的討議において熟議がなされやすい要件の一端を提供した。
抄録全体を表示
-
椎久 翔太, 竹内 勇剛
セッションID: 4R3-OS-8b-04
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
一般に小集団における意思決定過程では,成員それぞれに自分の意見や考えを明示的に表明できる機会が多くあり,その分,多数決による採決や一部の特定の人物に最終的な決定を委任することが多い大集団での場合と比較して,成員による妥協や新たなアイディアの提案など複雑かつ創発的な相互作用が生じている可能性がある.ところがこのような小集団で多く観察される成員による妥協や新たなアイディアの提案といった創造的な側面を含む相互作用系は今日まであまり注目されてきていない.そのため,小集団における意思決定後の各成員が得られた結論に基づく事項に対してどのような態度や行動を示すのかについての予測は困難である.本研究は,小集団の意思決定の過程において個々の成員がその過程での相互作用とその結果に対する満足度を変数として,それを報酬系に組み込んだ強化学習モデルの構築を通して,各成員がその集団が得た結論に対してポジティブな態度で受け入れ,同時に意思決定に際して結論に至るまでに要する時間を短縮させる効果を与えることを明らかにした.
抄録全体を表示
-
吉田 尚人, 國吉 康夫
セッションID: 4S1-OS-30a-01
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
恒常性は生存する動物において最も基本的な性質である.恒常性強化学習は身体内部の情報をもとにした内的な動機づけと身体内外のカップリングしたダイナミクスによって,生存に対し統合的な行動の創発を実現する.我々はこれまで,深層強化学習を組み合わせた深層恒常性強化学習での行動創発を実現してきた.しかしこれまで観察された行動は,餌へのナビゲーションや身体運動での温度制御など,恒常性に対して自明な行動の創発に限定されていた.一方で実際の動物では他の動物への攻撃や建築物の構築をはじめ,恒常性に対して自明でない行動もみられる.本研究ではこのような恒常性に対して一見非自明な行動が,実は恒常性から生じることを実験的に示す.そのために深層恒常性強化学習を,オープンエンド性をもつcrafter環境において実行し,長期生存が可能なエージェントを構成した.このエージェントを評価することで,餌や水の収集のような自明な行動創発とともにゾンビへの攻撃やシェルターの構築をはじめとする非自明な行動創発が観察された.本研究では最後に,この非自明な行動創発に必要な環境ダイナミクスの性質について議論する.
抄録全体を表示
-
野口 渉, 飯塚 博幸
セッションID: 4S1-OS-30a-02
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本研究では,生物のもつような階層的な空間認知がいかにして獲得されうるかを考える.例えば,ヒトが建物内での自身の位置を認識するとき,建物内のどの部屋にいるか,部屋内のどこにいるか,という少なくとも2つのスケールで空間的位置を認識する.一方で,生物が感覚器官を通して得る外界の観測そのものは,階層化された情報をもたらすものではなく,階層的な空間認知は,環境における感覚運動経験を通して獲得されるものと考えられる.我々は,視覚運動経験を通して階層的な空間認知を獲得するモデルとして,共有のRNNモジュールが階層的に結合した神経回路網モデルを提案する.提案モデルは,エージェントの視覚および運動系列を入力とし,運動の結果得られる未来の視覚入力の予測学習を通して,その神経結合を変化させる.実験では,複数の部屋が通路でつながったシンプルなシミュレーション環境における移動ロボットエージェントの視覚運動系列において提案モデルを学習させた.結果として,モデルの下位層において部屋内でのロボットの空間的位置,上位層においてロボットのいる部屋の環境全体に対する空間的位置の表現が自己組織化することが確認された.
抄録全体を表示
-
Adam PONZI, Keisuke SUZUKI
セッションID: 4S1-OS-30a-03
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
Perceptual illusions, like the rubber-hand and ventriloquism, demonstrate that simultaneous but spatially separated multisensory stimuli are combined into a single unified percept, but only if they are not too far apart. Here we show that when a feedforward plastic network is trained on spatially congruent multisensory stimuli, it develops spatial tuning which facilitates the accurate reproduction of multiple empirical findings, providing the network endogenously generates activity that is just above a transition from a stable fixed point state to a chaotically fluctuating one. Training selectively enhances the activity of some multisensory neurons and silences others, suppressing chaos specifically for those congruent multisensory stimulus combinations. After training, multisensory stimuli that fall in a distinct low spatial disparity regime activate highly reproducible fixed point attractor responses associated with a unified percept, while the network states activated by more spatially disparate multisensory stimuli fluctuate inconsistently across trials and represent segregated percepts.
抄録全体を表示
-
宮澤 和貴
セッションID: 4S1-OS-30a-04
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
近年の深層学習の発展により、言語モデルの性能は大幅に向上している。高度な言語処理能力を持つ大規模言語モデルが実現され幅広く活用されている。さらに、言語情報だけでなく、画像や音声、ロボットの行動まで含め、大量のデータから学習することで、実世界の情報を理解し、行動選択が可能なモデルも提案されている。人間が自身の主体的な経験にもとづいて言語を獲得する一方で、これらのモデルは、さまざまな主体が生成した大量のデータをもとに学習することで、言語や実世界の理解を深めている。Web上にある大量の他者の言語的経験をもとに学習された大規模言語モデルが、ある身体を持つ主体としてのロボットの言語獲得にどのように利用可能であり、我々の言語獲得や理解の仕組みとどのように異なるのか?これらの問は非常に興味深い。そこで、本研究では、人間の身体に制約された言語獲得とは異なる、ロボットの新たな言語獲得の仕組みについて議論する。具体的には、移動と物体操作能力を備えたモバイルマニピュレーターを2台用いて、他者や環境との言語を含めた相互作用について考察する。
抄録全体を表示
-
廣田 隆造, 西郷 甲矢人, 田口 茂
セッションID: 4S1-OS-30a-05
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
生命は、外界との相互作用を通じて自らの構成要素や状態を刻々と変化させながら、それ自身の個体性を保っている。「自律性(autonomy)」と呼ばれるこのような性質は、生命と非生命を分けるものの一つとされ、さまざまなかたちでの形式化・モデル化が試みられてきた。特にその中では、特定のものが何らかの演算やプロセスなどを経ても元のものへと戻ってくるという性質を指す「閉包(closure)」の概念が鍵を握ってきた。本研究では、閉包と呼ばれるもの一般を最もシンプルに捉えた数学的概念である「モノイド」(ただ一つの対象と、一つとは限らない自己射からなる圏)として自律性を形式化することで、その本質的なあり方をより簡潔に捉えることができることを論じる。この見方によれば、自律性は「AがなければBはない」という「媒介(mediation)」の関係がなすモノイドであること、すなわち、自らが自らを媒介する「自己媒介」性として理解できる。このような自律性の一般的な形式化は、生物的な自律性のみならず、より幅広い文脈における自律性、あるいは「自己」と呼ばれる現象のより深い理解につながると考えられる。
抄録全体を表示
-
今泉 拓, 李 璐, 西川 菜月, 熊崎 博一, 植田 一博
セッションID: 4T1-OS-6c-01
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
深層学習による顔認識は高い精度を誇るものの、必ずしも人間らしい判断をしているわけではないことが知られている。FaceNetを用いて不気味の谷の再現を試みた研究では、特定の顔画像に対する人間による評価とFaceNetによる評価が大きく乖離したため、不気味の谷の一部の特徴が再現されなかったことが示されている。特に、FaceNetが高評価を与えた画像については、口やあごといった顔面下部への局所的な注目がみられた。この局所的注目は自閉スペクトラム症者(以下ASD者)の特徴と一致している。そこで、本研究ではFaceNetの評価がASD者と類似しているかどうかを検討した。FaceNetの評定値を従属変数とし、定型発達者(以下TD者)による評価とASD者の評価を独立変数としてそれぞれ回帰分析を行った。その結果、ASD者の評価がFaceNetとより類似していることが明らかになった。この結果は、顔認識アルゴリズムが広域的な顔情報を利用できれば、不気味の谷のような特異な認知現象をより正確に再現できる可能性があることを示唆している。
抄録全体を表示
-
藤井 俊輔, 滝 之弥, 吉田 温登, 西川 菜月, 小森 政嗣, 植田 一博, 加藤 邦人, 原 武史, 熊崎 博一, 寺田 和憲
セッションID: 4T1-OS-6c-02
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
自閉スペクトラム症者は,同年齢の定型発達者と比べて,偏食が問題となることが多い.ASD者はTD者よりも,高い視覚的な細部やパターンを識別する能力,特定の視覚的パターンや対象物に対する高い感受性を有するため,視覚的な食品の選好によって偏食を予測できる可能性がある.本研究では,目玉焼きを対象として,食品の外観を構成する多次元の視覚的特徴空間上の効用関数を同定することで,ASDとTDの視覚的な食物の好みの違いを調査した.ASD群(n=11)とTD群(n=10)の実験参加者は,StyleGAN2を用いて学習した目玉焼きの外観を構成する潜在空間から生成された目玉焼き画像を見て,目玉焼きの食べたさの評価を行った.実験の結果,ASDとTDで目玉焼きの選好に寄与する視覚的特徴に大きな違いがない可能性が示された.しかし,我々が用いた潜在特徴空間が,視覚的選好を表現するために必要十分でなかった可能性があるため,もつれほどきを行い,より精密な効用関数の同定を行うことで,ASDとTDの視覚的食品選好の差異を明確にできる可能性がある.
抄録全体を表示
-
竹田 優那, 瀬田 稀介, 大本 義正, 熊崎 博一, 岩永 竜一郎, 今村 明, 清水 日智, 寺田 和憲
セッションID: 4T1-OS-6c-03
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
自閉スペクトラム症(ASD)の診断には時間がかかり、定量的な方法が必要である。しかし、ASD児の症状は多様であるため、一貫したデータを得ることは難しい。さらに、ASDは運動協調や姿勢制御に影響を及ぼす。そこで我々は、ASD児と定型発達児では運動協調能力が異なるという仮説を立てた。我々はLSTMを用いて、片足立ちなどの協調運動中の身体の時間的変化を予測するモデルを構築した。ASD高リスク児とASD低リスク児の実際のデータとモデルの予測値を比較したところ、足首の角度変動における予測値と実測値の差において有意な差が認められ、SRS-2スコアと相関が示された。
抄録全体を表示
-
金子 颯汰, 山田 誠二
セッションID: 4T1-OS-6c-04
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
人工知能技術(AI)の発達と共に自動運転やチャットボットなどAIを利用したシステムの利用への関心が高まっている.このようなシステムが利用において過信するとシステムの誤用に繋がり,不信に陥るとシステムの利用効率の低下が引き起こされる.自動運転に代表されるような人間-AI協調意思決定システムにおいてシステムの誤用や利用効率の低下を抑制するには,「人間のAIに対する信頼(AIの信頼)」を適切に保つことが重要である.そこで直接観測不可能な潜在変数を取り扱い可能なStructural Equation Modelling (SEM)を時間軸に拡張したDynamic-SEMによって,時間経過と共に動的に変化するAIの信頼の予測モデルの構築を行なった.構築した予測モデルによって過信の予測が可能であることが確かめられた.
抄録全体を表示
-
前東 晃礼, 福地 庸介, 山田 誠二
セッションID: 4T3-OS-6d-01
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本研究では,視覚的課題における説明可能なAI(XAI)の説明量を最適化するインタフェースデザインを検討するために2つの実験を行った.実験1では,古典的な視覚探索課題を用いて,説明の種類がXAIへの信頼に与える影響を検討した.その結果,(1)難易度の低い課題では,AIの解答のみが表示されることで信頼が上昇し,(2)難易度の高い課題では,AIの解答と解釈可能性の高いAIの注意のヒートマップの表示が信頼度を向上させることが示された.実験2では,実験1の結果に基づいてデザインされた説明表示が,課題のパフォーマンスに及ぼす影響について,応用的な識別課題を用いて実験を行った.その結果,(3)難易度の低い課題では,AIの解答のみが表示されると,複数の説明を表示したAIを利用した場合よりもパフォーマンスが向上し,(4)難易度の高い課題では,AIの解答と解釈可能性の高いAIの注意のヒートマップの表示が,その他複数の説明を表示したAIを利用した場合よりもパフォーマンスが向上することが示された.本研究により,ユーザの認知的負荷を削減し,最適に説明を提示するXAIデザインの重要性が示された.
抄録全体を表示
-
福地 庸介, 山田 誠二
セッションID: 4T3-OS-6d-02
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
説明可能なAIと大規模な言語モデルの開発により、AIベースのシステムはAIの予測に対して様々な種類の説明を生成できるようになっている。本稿では、こうした説明をユーザにどのように提供するかを動的に決定する問題を考える。具体的には、AIベースシステムがどの説明を強調すべきかを決定するためのプロトタイプ手法を提案する。本手法は、説明のある点を強調した場合としない場合でユーザの判断にどのような影響があるかを予測し、予測をもとにユーザの判断をAIが推奨するものへと導くことを目指す。本稿では提案手法を株価予測AIの支援つき株式取引シミュレータに実装し、その可能性について議論する。
抄録全体を表示
-
三宅 圭音, 山田 誠二
セッションID: 4T3-OS-6d-03
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
現代社会において, 人工知能(AI)の利用は日常的であり, AIとの協力がますます重要性を増している. しかし, AIの能力が人間より高いにもかかわらず, AIの出した結果ではなく人間の出した結果を優先してしまう現象があり, それをアルゴリズム忌避と言う. 専門性の高い人はアルゴリズム忌避が高い傾向にあり, アルゴリズムの出した結果を参考にしないことがある. 例えば, 読影医は非常に高い技術を要求され, 専門性が高い職業の一つであり, アルゴリズム忌避が起こりやすい状況にある. 過去の研究では, AIの出力をわずかでも調整することができればアルゴリズム忌避が軽減される可能性が示唆されている. この背景から, 本研究の目的は, 胸部X線画像のセグメンテーションタスクにおいてAI出力の調整によるアルゴリズム忌避の抑制ができるかを実験的に解明することである. 具体的には, AIの出力を変更できる状況であれば, AIへの印象が良くなり選択する傾向が高くなることを検証する. これにより, 読影医によるアルゴリズム忌避が抑制され, AIとの協力が促進されることが期待される.
抄録全体を表示
-
高木 寿, 李 楊, 寺田 和憲, 小森 政嗣
セッションID: 4T3-OS-6d-04
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
信頼行動は,信頼者が,期待を裏切られるリスクを受け入れた上で高い見返りを期待して,被信頼者に自らの利得決定を信託する行動である.これまでの研究で,裏切りの意図帰属によるリスクの過大評価によって信頼を低下させる裏切り嫌悪バイアスの存在が指摘されている.一方,人よりもアルゴリズムによる意思決定を回避するアルゴリズム嫌悪バイアスの存在も指摘されている.本研究は信頼における,裏切り嫌悪とアルゴリズム嫌悪の影響を調査するため,意思決定対象と対象の意図性を操作した実験を実施した.実験参加者(n=284)は,(a)意図的に決定する人,(b)アルゴリズムによって決定するAI,(c)ランダムに決定する人,(d)ランダムに決定するAIのいずれかと,相手の返報率が既知の信頼ゲーム,さらに,信頼ゲームと構造上等価なくじ引き課題をプレイした.信託するために必要な最小返報許容確率を指標とした分析の結果,人/AIの違いや意図性の違いは信託に影響を与えず,いずれの場合でも単純リスク課題に比べて信託率が高かった.この結果は,協力過信バイアスとアルゴリズム過信バイアスの存在を示唆する.
抄録全体を表示
-
青木 颯大, 市野 弘人, 高橋 達二, 樋口 滉規
セッションID: 4Xin2-01
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
これまで多くの認知科学研究が,人間が観察データから変数間の因果関係を学習する認知過程を数理モデルで説明することを試みてきた.また,その殆どのモデルが,着目する変数が2値変数に限定された枠組みを使用している.それは人間が取り組む問題の複雑さに反して過度に単純化された枠組みであり,人間の因果帰納に関する認知過程の解明はもとより,その認知科学的知見を実世界の意思決定問題やAI分野へと応用するためには,理論的な枠組を多値変数へと拡張する必要がある.ここで,多くの先行研究が,人間の因果帰納の初期段階が相関検出に基づいていると想定している.確かに2値変数に限定された枠組において,連関は相関と定義上区別することができず,連関について個別に考慮する必要はない.しかし,対象となる変数が3つ以上の値を取りうる場合には,相関と連関は定義上区別されるため,枠組を多値変数へと拡張する際には,改めて人間が因果帰納に際して具体的に相関と連関のどちらを検出しているかを検証する必要が生じる.本研究では,多値変数間の因果関係の推論課題に関する認知実験を実施し,結果に基づき検証を行った.
抄録全体を表示
-
太田 葵, 江上 周作, 柴田 祐樹, 高間 康史, 福田 賢一郎
セッションID: 4Xin2-02
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本研究では,居住者の行動により時間的に変化する日常生活空間において,屋内を巡回するエージェントの観測履歴と家庭内の物体配置に関する常識的な知識を利用して,物体の最新位置を予測することを目指している.しかしながら,先行研究には,居住者の行動による物体移動の再現,エージェントの視野と観測結果の一致など,実環境への応用に向けた課題が存在する.そこで,本発表では,人の行動シミュレーション結果に基づく物体位置変化データを実験環境として利用することで,より実環境に近似した環境における物体探索手法の性能を評価する.具体的には,3次元住空間シミュレータのVirtualHome-AISTを用いて,先行研究で提案された実験環境を拡張する.実験の結果,実環境に実装する際に考慮すべき課題が明らかとなり,本稿ではこれを考察する.
抄録全体を表示
-
佐藤 公一郎, 水野 一徳
セッションID: 4Xin2-03
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
点や線分,図形などを組み合わせることで表現される芸術作品は,抽象画と呼ばれている.抽象画の作成には,画像編集ソフトを用いたものが一般的だが,編集技術を持たない人が好みの画像に加工するには労力がかかってしまう.また,従来の生成手法では,限定的な操作が多いため,表現の幅が狭まり,単調になってしまう場合がある.そこで,本研究では,入力画像に対して多様な抽象画風テクスチャに加工する手法を提案する.具体的には,テクスチャ生成手法である「Ant Painting」を用い,人工アリの創発現象により,入力画像の特徴を保ったまま抽象画風の描画を行う.また,人工アリが持つパラメータを,対話型進化計算によって調整を繰り返す.入力画像による実行例を示すことで,提案手法がユーザの嗜好を保ちつつ,多様な抽象画風テクスチャの描画ができることを示す.
抄録全体を表示
-
吉野 智稀, 佐々木 稔
セッションID: 4Xin2-04
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
ゼロショットスタンス検出において、トピック不変表現の学習と外部知識の利用が高い成果を得ている。これらの手法の中で、PT-HCLモデルは対照学習を用いたゼロショットスタンス検出への効果的なアプローチを提示している。本研究では、トピック不変表現に外部知識を追加して同時に学習させる、新しいスタンス検出モデルを提案する。結果としてSem16データセットに対して4つのトピックにおいてWikipediaを利用しない場合と比べ精度の向上が見られた。また、情報量の増加などにより学習速度の鈍化が見受けられた。現状では課題も多く学習段階における評価方法の見直しや訓練データとWikipedia情報への重み付けによる調整が必要である。
抄録全体を表示
-
鈴木 悠悟, 森村 哲郎, 岡 達志
セッションID: 4Xin2-05
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
インターネットを介して商品やサービスを販売するウェブサイトである電子商取引(Electronic Commerce, EC)サイトにおいて,広告は売上促進のための主要な手段として活用されている.そのため,広告の効果を推定し,広告戦略を評価することが重要である.しかし,売上は季節性,市場動向,消費者の行動パターンなど,様々な要因によって変動するため,広告効果や広告運用の評価は容易ではない.特に,単に売上を予測するだけでなく,広告がどのように売上に影響を及ぼすかを明らかにするためには,予測モデリングだけではなく因果推論の考え方が必要になる. 本研究では,ダブルマシンラーニング(DML)という機械学習と因果推論を組み合わせたアプローチを採用して,EC サイトの購買データを分析し,広告効果と広告運用の評価を行う.さらに,データの特性を考慮した潜在変数を取り入れたDML を提案し,その効果を検証する.分析結果から,広告効果の推定においてDMLが潜在的な売上効果を推定できるということ,データが少ない場合では潜在変数を考慮したDMLにより正しい効果を推定できることが示唆された.
抄録全体を表示
-
渋谷 優介, 澁谷 紘人
セッションID: 4Xin2-06
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
言語モデルが文章の構造や繋がりを認識できているかどうかを確かめることは、言語モデルを理解するにあたって重要な観点である。地名、人名などの固有表現は言語の主要な構成要素のひとつであり、言語モデルの理解にあたって、言語モデルにおける固有表現の認識に関する研究は重要なテーマである。大規模言語モデルでも同様に固有表現認識は重要であるが、一般の言語モデルと比べて固有表現認識のためのデータセットの整備などで研究の余地がある。 そこで本研究では、大規模言語モデルの学習データの固有表現かつ拡張固有表現階層の固有表現を含む新しいベンチマークデータセット「J-NER」を作成した。このデータセットを用いて、大規模言語モデルのGemini ProやGPT-3.5、ELYZAなどで評価したところ、正解率やF1スコアにバラつきが見られた。このことは、J-NERが大規模言語モデルの固有表現認識力を測定するのに有効であることを示唆する。J-NERを用いた評価を通じて、大規模言語モデルの固有表現認識能力に関する深い洞察が得られることが期待される。
抄録全体を表示
-
大島 遼祐, 牧原 昂志, 松澤 郁哉, 品川 政太朗, 孫 延君, 森島 繁生, 片岡 裕雄
セッションID: 4Xin2-07
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本研究では、大規模言語モデル(LLM)に基づくマルチエージェント雑談対話において、対話破綻を生じさせる発話の分析を行う。人物行動のシミュレーションは大規模言語モデルを利用したエージェントを用いた例が提案されているが,より信頼性の高いシミュレーションを実現するためには重要な要素の1つである対話内容についての分析を行うことが必要である.そこで我々は,雑談対話においての破綻の原因となるLLMエージェントの発話の傾向について調査する.テーマとエージェントの属性を与えた上の2人のエージェントの対話に対して,破綻の原因のアノテーション実験を行なった.対話破綻を生じさせる発話の類型を行った結果、LLMエージェント特有の発話エラーが発生することがわかった。
抄録全体を表示
-
村松 雄介, 稲津 正, 伊藤 修
セッションID: 4Xin2-08
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
製品やサービスが人々の五感に訴え、生活の質を豊かにするためには、行動と感情の複雑な相互作用を理解し、共感する価値提供が不可欠である。この目的を達成するために、本研究は、文献レビューと質的インタビューを踏まえた仮説構築と、その後のアンケートデータに基づく統計的因果探索を組み合わせるハイブリッドアプローチを採用した。行動プロセスデータの収集は、仮説に基づく人々の経験から行動と感情の経路を探索する質問紙を設計し、アンケートを通じて行った。深層学習による統計的因果探索モデル(Structural Agnostic Modeling, SAM)を用いて行動プロセスの因果関係を明らかにした。分析により、行動と感情の間に存在する因果関係と、仮説とは異なる新たな因果関係が明らかになった。この発見は、人間の感情と行動のジャーニーを解釈し、人間の多様な行動パターンをより深く理解するための基盤を築くものである。今後の研究では、この統合的なアプローチを用いて、さらなる行動パターンの探索を目指す。
抄録全体を表示
-
鈴木 俊詞, 柴田 祐樹, 高間 康史
セッションID: 4Xin2-09
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本発表では,協調フィルタリングを用いた書籍推薦に利用可能な人工データを,知識グラフ埋め込みを用いて生成する手法を提案する.情報推薦システムでは主要技術として協調フィルタリングが用いられるが,新規ユーザ・アイテムなどの評価件数の少なさが原因となるcold-start問題など,データ量に起因する課題が指摘されている.また,近年プライバシー保護の動きが拡大しており,実在するユーザの情報を収集し,活用することが問題視されるようになってきている.これらの課題を解決する手段として,実データから統計的特徴を取り出して人工データを作成し,機械学習や情報推薦に用いるアプローチが研究されている.提案手法では,ユーザの読書履歴に関するGoodreadsデータセットから知識グラフを構築し,TransEを適用してリンク予測によりユーザの読書行動をシミュレートした結果に基づき人工的な評価値行列を合成する.書籍推薦タスクにおいて,実データから生成した評価値行列との比較実験を行い,提案手法の有効性や特性について考察する.
抄録全体を表示
-
河野 太郎, 楓 紘希, ジメネス フェリックス, 宮本 友樹
セッションID: 4Xin2-10
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
近年,教育支援ロボットが注目されている.従来研究において,学習開始前にロボットと会話しながら,学習者が解答する問題数を提案することで,学習者の学習意欲を向上することが可能であると報告されている.しかしながら,学習開始前,学習後など問題数の提案するタイミングについては未検証である.そこで本稿では,問題数の向上を促すロボットの会話タイミングを大学生による被験者実験を通して検証する.具体的には,学習前,学習後,学習前後時における会話を比較し,ロボットが学習者に与える印象効果を検証する.
抄録全体を表示
-
渡辺 蒼, レオ チーシャン, 西崎 博光, 星野 准一, 宇津呂 武仁
セッションID: 4Xin2-100
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本論文では、接客における店員の発話内容の質を向上させるため、複数の大規模言語モデルを用いて店員の接客発話を訂正する方法を提案する。加えて、店員の発話内容を点数化し、採点の根拠となる解説を生成する。店員の発話内容を修正し、定量的評価を行うことで、適切にフィードバックを行うことができるようになる。本研究では複数のLLMを活用する方法の一つとしてReConcileという円卓会議の手法を採用する。評価実験の結果、ReConcileを用いて複数のLLMの出力を統合し,洗練することで、単一のLLMよりも発話内容を適切に修正することができ、かつ人間の感覚に近い評価点を付与することができた。
抄録全体を表示
-
永崎 研宣
セッションID: 4Xin2-101
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
仏典研究は他の人文学分野と同様に、長らく人手で行われてきており、それに伴う様々な限界と制約があった。近年のAIの性能向上と普及は、その限界を大きく拡張した。本発表では、主に、筆者らが取り組んでいる文献学におけるAI-OCRの多大なインパクトとそれを活かした協働デジタル研究環境について報告する。これに加えて、多言語仏典の相互翻訳におけるAIがもたらした性能向上の状況等にも言及し、それも踏まえた仏典研究の全体的な将来像について提示したい。
抄録全体を表示
-
駒田 啓伍, 阿部 香央莉, 守屋 彰二, 鈴木 潤
セッションID: 4Xin2-102
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
対話システムにおいて長期間に分かる発話の整合性を保つことは現在の技術でも容易ではない。 タスクが事前定義できる場面において、タスク遂行に必要な項目の記録領域(Slot)を事前定義し、対話の進行に合わせてSlotを更新することにより、長期間の整合性を向上させる方法が提案されている(Slot-filling)。 本研究の目的は、従来法では対応が困難な、対話の状況変化に目的設定を合わせていく必要のある場合(職業訓練でのロールプレイ・TRPGなど)において、長期間の整合性を保つ方法を提案することである。 本研究では、TRPGのゲームマスターを題材とし、外部に置く動的なSlotとしてGPTの出力を利用したシステムを作成し、その効果を実証した。 結果から、整合性において提案法が優位であることが示せた。
抄録全体を表示
-
Muhammad Firdaus MAULANA, Yugo OKAMOTO, Okabe KOHEI, Eri SATO-SHIMOKAW ...
セッションID: 4Xin2-103
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
We propose a system that is used to help keep users motivated while practicing alone at home by providing feedback using multi-modal sensors. Muscle is important for movement in the body, while frailty affects older individuals' physical function and health. Home-based training can help address frailty, but motivation and adherence can be challenges. A support system is needed to provide appropriate interventions and maintain motivation. The system aims to monitor the quality of the user's training and maintain the user's motivation by providing feedback on the training. To measure the quality and provide feedback, we use a camera with pose estimation to obtain information related to the user's pose, and an IMU sensor to obtain the user's inertial data during training. We have implemented pose estimation to calculate and analyze the calculation of squats movement, and we also consider analyzing the duration, LDLJ, and DTW data from the IMU data.
抄録全体を表示
-
LUO Ying, 小林 一郎
セッションID: 4Xin2-104
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
最近,マルチモーダルモデルBrainLMが導入され,テキスト-脳符号化・復号化タスクにおいて優れた有効性を示した.本研究では,このBrainLMをさらに発展させ,新たなデータセットと未知の言語システムに適用することを試みた.転移学習技術を採用することで,多言語学習タスクにおけるモデルの可能性を拡張し,その汎化能力を向上させることを目指した.特に,二値分類タスクの微調整プロセスにおいて,BrainLMは51.75%の最高精度を達成した.本研究では,脳予測タスクに対して転移学習を行う前後のモデルを比較することで,約3%~15%の相関係数の改善を得た.さらに,大脳皮質全体を対象とした脳予測課題では,BrainLMが他のモデルと比較して最も高い相関を示した.本研究は,BrainLMの応用範囲を広げるだけでなく,多様な言語環境における脳機能領域と大規模言語モデルの複雑な相互作用に光を当てるものである.
抄録全体を表示
-
山﨑 悠大, 上坂 大輔, 黒川 茂莉, 浅川 善則, 山口 求
セッションID: 4Xin2-105
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
近年,ChatGPT含むLarge Language Model (LLM)が開発され,その入力に推論過程の例や指示を入力して推論精度を向上させるChain of Thought(CoT)が提案されている.しかし,LLMの推論過程は人とは異なるため,ユーザの情報からその意図を推論するような高度なタスクでは,依然としてLLMの推論精度が低いという課題が残る.よって本研究では人の属性や性格,行動情報を含むペルソナデータから任意の意図の度合いをリッカート尺度で推論するタスクにおいて心理学モデルを導入したCoT手法を提案する.274名を対象に実施したアンケートデータより年齢,性別,性格特性などからボランティア参加意図の程度を推論するタスクで提案法の精度を検証したところ,提案法は従来のCoTに比べてMean Absolute Errorにおいて5.5%の精度向上を達成した.さらに本研究ではこの意図推論手法を用いて異なる要素を持つペルソナから近い意図を持つペルソナをマッチングするフレームワークを提案する.心理学モデルの知見を活用した提案法によって意図推論タスクの精度向上やデータ拡張が可能になることが期待される.
抄録全体を表示
-
小俣 敦士, 榎本 優香, 増川 ねてる, 石川 翔吾
セッションID: 4Xin2-106
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本発表では,ナレッジグラフとLLM(Large Language Model)を活用したチャットボットを用いて,専門的概念の獲得を支援する手法について述べる.他言語の専門的概念の翻訳に伴い,文化的・言語的ニュアンスの違いが生じることで,学習者の正確な理解を阻害するという課題がある.この課題に対応するため,ナレッジグラフを用いて専門的概念を構造化し,LLMベースのチャットボットの外部知識として活用することで適切な概念獲得を支援する.本研究では,日本において普及が進んでいるリカバリー概念に着目し,ナレッジグラフの構築とチャットボットの開発を行った.大学生を対象としたユーザビリティテストを通して,質問応答における課題を抽出し,質問内容に基づくナレッジグラフの利用と回答生成プロンプトの設計改善を行なった.その結果,質問内容に基づくナレッジグラフの利用により,ユーザは適切な概念や情報を得ることができ,概念獲得支援への有用性を確認した.
抄録全体を表示
-
黒川 茂莉, PULAK Ranjan Giri, 斉藤 和広
セッションID: 4Xin2-107
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
知識グラフは,質問応答などの様々なアプリケーションでよく使われる知識ベースである.知識グラフはしばしば欠損を含むため,知識グラフの補完は基本的な問題である.本論文では量子回路の表現力を活かすため,知識グラフを埋め込む量子回路学習に対し,アンサンブルを行うことで埋め込みの過剰適合を抑制する方法を提案する.知識グラフの補完精度の観点で評価し,古典計算機による手法やアンサンブルを行わない量子回路学習の手法に対して精度向上を確認した.
抄録全体を表示
-
Hang ZHANG, Weijie CHEN, Danilo Vasconcellos VARGAS
セッションID: 4Xin2-108
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
Identifying unfamiliar or unusual objects on the road poses a significant challenge in autonomous driving. While recent studies have achieved high accuracy in identifying anomalies of regular size, the detection of smaller objects remains a more complex problem. Here, we introduce AutoFocusAnomaly (AFA), a practical approach designed to enhance the detection of small anomalies. AFA integrates a modified version of the AutofocusFormer segmentation model with the classic uncertainty estimation function, particularly the maximum logit (i.e., the highest values among classes in the model's output). To assess the performance of the method, we take a portion of the Lost And Found (LAF) dataset to render it suitable as a new dataset called LAF Far (LAFF) for small anomaly segmentation. Results show the effectiveness of our method in anomaly segmentation. Specifically in the small anomaly segmentation task, we obtain the highest Average Precision (AP) coupled with a competitively low false positive rate, which is significantly better than State-Of-The-Art(SOTA) methods. We believe that these might shed light on future research in the domain of small anomalies segmentation.
抄録全体を表示
-
木本 晴久, 人見 雄太, 佐藤 大地, 跡部 優吾, 小山 正彦, 片田 智大, 橋本 圭, ジューストー 沙羅, 守屋 貴行
セッションID: 4Xin2-109
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
本研究では,キャラクターをロールプレイしているチャットボットを自動評価する手法を提案する.提案手法は,2つの手続きを通じて行われる.まず,ロールプレイするキャラクターの過去のセリフや発言からキャラクター設定を抽出する.その後,ロールプレイしているチャットボットに対して,抽出されたキャラクター設定を用いて自動評価を行う.本実験では,Aww, Incが開発したバーチャルヒューマンであるimmaのXのポストデータに対してキャラクター設定の抽出を実施した.その結果,54件のキャラクター設定を抽出することに成功し,そのうち44件は人手評価により妥当と評価された.さらに,キャラクター設定を用いた自動評価では,85.1ポイントの精度で適切に評価できることが明らかになった.
抄録全体を表示
-
高野 海斗, 中川 慧
セッションID: 4Xin2-11
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
金融テキストマイニングにおいて,極性分析は重要なタスクである.しかしながら従来の金融極性分析は,業績などへの影響が直接記載されたテキストを対象にしたものが大半である.実務上の投資判断を鑑みると,直接的に極性が記載されていないテキスト情報に対して,バックグラウンドを踏まえつつ極性を推論することが求められる.特に,ニュースがほとんど存在しない中小企業に対してはこのような極性の推論が必要不可欠である. そこで本研究では,大規模言語モデル(LLM)の推論能力を活用し,推論ベースの極性分析タスクに取り組む.具体的には,背景として企業の事業概要を入力し,ある特定の重大イベントが当該企業に与える影響を推論させた上で極性を付与する.そして,その出力が実務的にどの程度有用であるか検証する.
抄録全体を表示
-
加藤 靖久, 金子 正弘, 岡崎 直観
セッションID: 4Xin2-110
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
大規模言語モデルは英語タスクにおいて高い性能を示す一方,低資源言語タスクを解く際には相対的に性能が低くなることが知られている.そこで,この問題を解決するために本論文では多言語例を用いたfew-shot推論を提案する.本研究では低資源言語下における大規模言語モデルの推論性能を測る指標として自然言語推論タスクを用いた.結果として,私たちの提案手法はFEVER,ANLIという二つのタスクにおいて性能改善がみられることを示した.
抄録全体を表示
-
竹中 誠, 谷中 瞳
セッションID: 4Xin2-111
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
人間は様々な事前知識をもとに,ある物体のあらゆる方向からの見え方を想像することができる。本研究では,近年の大規模生成モデルがこの能力を有するかどうかを測るためのタスクを提案し,現行のモデルについて分析を試みる。具体的には,ある物体の正面画像と,同じ物体を別の視点から見た画像をモデルに入力し,入力した画像の視点を問うタスクとする。評価データセットは,意匠データベースのスケッチ画像と視点情報が述べられたテキストをデータソースとして構築した。実験では,GPT-4Vを対象として構築した評価データセットを用いて空間理解能力に関する分析を行う。実験の結果から,GPT-4Vの空間理解能力の可能性と課題について考察する。
抄録全体を表示
-
齋藤 和広, 米川 慧, 村松 茂樹, 黒川 茂莉
セッションID: 4Xin2-112
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
様々な機械学習モデルが実用的に利用される社会において,データの加工から学習・推論の一連の流れである機械学習パイプライン(MLパイプライン)の重要性が増し,MLパイプライン管理プラットフォームの開発が進められている.本プラットフォームは,機械学習の学習・推論処理において,MLパイプラインのプロセスごとに計算リソースを割り当てて実行される.しかし,現在のプラットフォームはMLパイプラインが利用するCPUやメモリなどの計算リソースを事前に設定しておく必要があり,実態の計算リソース利用量を考慮できず,過剰に確保してしまう課題がある.本論文では,MLパイプラインにおける各フェーズで利用されるリソース量を動的に予測し,必要最低限の計算リソースでMLパイプラインを実行するシステムを提案し,転移学習を対象に計算リソース利用の効率性を評価する.
抄録全体を表示
-
中村 考希, 中村 篤祥
セッションID: 4Xin2-113
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
モンテカルロ木探索は、近年のゲーム AI に目覚ましい進歩をもたらした技術の 1 つであるが、限られた時間内により良い手を見つけるために並列化が行われている。並列化においては、各プロセッサへの負担が均等になるようにハッシュなどを用いてタスク割り当てを行うが、モンテカルロ木探索ではそれを構成する4つのタスクの計算時間に大きな差があり、そのため一時的に偏りが生ずることが多く、待機時間が長くなり、プロセッサコア数に応じた恩恵を受けづらくなるという問題が生ずる。本論文では並列化手法であるMP-MCTS法に関して、最も時間を要するシミュレーションの専用プロセスを用いる方法において、盤面に応じて変化するシミュレーション時間を考慮した専用プロセスの割合制御により、並列化効率を上げる方法を提案し、オセロゲームによる対戦結果における効果を報告する。
抄録全体を表示
-
石井 奏人, 新妻 巧朗, 田口 雄哉, 山野 陽祐, 杉野 かおり, 田森 秀明
セッションID: 4Xin2-114
発行日: 2024年
公開日: 2024/06/11
会議録・要旨集
フリー
固有表現抽出をはじめとする系列ラベリングタスクでは、学習データの作成に多大なアノテーションコストがかかることが課題となっている。効率化を図るために、既存モデルによるラベリング結果をアノテーションの参考にする方法があるが、公開されている系列ラベリングモデルは人名や地名、組織名などの一般的なラベルセットで構成されるものが多くを占めているため、特定ドメインでのアノテーション時には事前にラベリングすることができない。本研究では、そのような特定ドメインに対する系列ラベリングタスクにおける学習データ作成の効率化を目的として、大規模言語モデルで事前にラベリングした結果をアノテーション時の参考として用いる手法を提案する。まず取得対象の系列の定義と出力形式を指定したプロンプトを用いて、入力テキスト中の対象系列をXMLタグで囲んだ形式で大規模言語モデルに出力させる。その後出力結果を整形し、アノテーションツール上にラベルの候補として表示する。これにより、データの少ないドメインにおいても事前にラベリング結果を提示できる。このシステムを用いて、本手法によるアノテーションのコストに及ぼす影響について報告する。
抄録全体を表示