人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
選択された号の論文の939件中901~939を表示しています
  • 井上 健二郎, 吉田 光男
    セッションID: 4Xin2-61
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    2022年のオンライン広告の総額は,前年比10.8%増の2,097億ドルに成長した.市場の成長に伴い,ディスプレイ広告に関する研究が盛んに行われている.特に,広告に対する消費者態度や,実際の購買行動との関連性を深く理解することの重要性が強調されている.しかし,広告の非言語的特徴が消費者に与える影響については研究が盛んな一方,言語的特徴が消費者に与える影響については十分に明らかでない. 本調査では,健康食品と化粧品を対象に,Instagramに配信した広告テキストを,LIWCの日本語版であるJ-LIWC2015を用いて,心理的プロセスに関わる言語的特徴を定量化し,CTR (Click-Through Rate) に与える影響を分析した.結果,健康食品広告は,特定の健康問題への解決策や予防法を提供することが有効であり,化粧品広告は,現状への意識を喚起し,視覚的魅力や美しさを強調することが有効であることが示された.一方で,消費者が特定の商品に対して強い関心を持っている場合,その商品の広告テキストが消費者のクリック行動に影響を与える可能性があり,言語的特徴よりも強い影響であることが示された.

  • 安部 樹生, 大槻 恭士
    セッションID: 4Xin2-62
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    ChatGPTに代表される大規模言語モデルベースの生成AIの登場を受け、2023年の人狼知能国際大会自然言語部門では生成AIを用いて対話を行うエージェントが多数参加し、従来に比べてより人間らしい自然言語による人狼ゲームが繰り広げられた。しかしそれらの人間らしさはうわべだけのもので、発言間や発言と行動の間には多数の矛盾が存在していた。この問題点への対策の1手法として、一貫性のある行動と発言が可能なプロトコル部門のエージェントをプロトコルと自然言語の相互変換に基づく自然言語入出力部で包むアーキテクチャが考えられる。本研究では、日本語GPT言語モデルを用いる文生成手法を応用して、人狼知能プロトコルに対応する自然言語に対してキャラクター性を付与することを試みた。まず人狼BBSの対戦ログからキャラクターごとに文を抽出し、会話に不要な文字列の削除などのデータの整形を行った。次にそれを用いて日本語GPT言語モデルjapanese-gpt-neox-3.6bのファインチューニングを行い、ある程度キャラクター性が付与された文章の出力が可能であることを確認した。

  • 大野 花純, 牧野 晃平, 三輪 誠, 佐々木 裕
    セッションID: 4Xin2-63
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究では,深層学習による時系列予測に必要な訓練データ不足の問題を回避するために,生成モデルで生成した大規模合成データを用いてデータ拡張する.しかし,既存の時系列生成モデルは現実世界で扱われる長期時系列の生成に適していない.そこで,長期時系列に適した生成モデルとしてiTransGANを提案し,iTransGANで生成した大量の合成時系列データを用いて長期時系列予測に対するデータ拡張の効果を調査する.実験では,Electricity Transformer Temperatureデータセットを用いて,iTransGANで生成した合成データの品質と,合成データを用いたデータ拡張の効果を評価した.結果から,iTransGANは既存手法よりも高品質な長期時系列データを生成できることを確認し,合成データを用いた事前学習はスクラッチで学習した場合と比べて,予測誤差を低減できる可能性があることを確認した.また,実データが少なくて大規模なモデルの学習がうまくいかない場合でも,合成データを利用した事前学習によって,大規模なモデルの学習が改善することを確認した.

  • 鈴木 丈慈, 坪井 辰馬, 大橋 玲音, 加藤 勇護, 櫻井 響, 坪倉 和哉, 小林 邦和
    セッションID: 4Xin2-64
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究では, 画像を用いた意思疎通を行うボードゲームである「ピクチャーズ」を通して, 能力や性格の個人差が抽象化・具体化能力に及ぼす影響を調査した. ピクチャーズは, 3名以上の参加者が交互に問題を出し合うことを繰り返すゲームで, 出題者は5種類の道具を使って20枚の写真カードの中の一つを表現し, 回答者は問題が対応する写真カードを推測する. 出題者には道具を用いて画像を抽象的に表すための能力が, 回答者には問題を具体化する能力が要求される. 実験では, 35名の回答者を対象に簡略化した問題を提示し, 正答率を算出した. 加えて, 個人の能力や性格特性に関する個人特性のデータを収集するためのアンケートを実施した. その後, 収集したデータをもとに回答者の個人特性と問題の正答率との相関分析を行った. 分析の結果, 抽象化・具現化能力が高いことを自覚している回答者ほど正答率が有意に高いことが確認され, 個人特性がパフォーマンスに影響していることが示唆された. 本研究は, 画像を用いて意思疎通を行う抽象化・具体化が必要なタスクに対する人工知能の発展に寄与することが期待される.

  • 野中 賢也, 田村 光太郎
    セッションID: 4Xin2-65
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    文章のタグ付けタスクは自然言語処理のおける最も基本的なタスクの一つである.言語処理技術の産業応用という面でも重要なタスクであり,ビジネス情報インフラを提供するユーザベース株式会社においては,経済記事のタグ付けタスクが頻繁に発生している.特に、同社が運営するFlash Opinionサービスでは、専門分野を表すタグを付けることによって、ユーザーの質問と専門家をマッチングしている。ここで,質問のタグ付けを行うオペレーターの作業負荷を軽減する必要があり,本研究では,この課題に対して機械学習技術を用いたタグの推薦を考える.タグの推薦問題を従来のマルチラベル分類問題として定式化する場合、タグが追加または削除されるたびにモデルを再学習する必要がある.したがって,本研究では、大規模言語モデルを用いたタグ名によるデータ拡張を利用して、タグと質問テキスト間の距離学習の問題へと変換する方法を示す.実際の業務で得られたデータセットに提案法を適用し、マルチラベル分類モデルより精度良く紐づくタグを推薦できることを検証した.

  • 中井 諒馬, 石川 琉聖, 橋本 俊甫, 井上 博之
    セッションID: 4Xin2-66
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデル(LLM)が入力に対し不正確な応答をする現象は幻覚(Hallucination)と呼ばれ,LLMの社会実装における重大な問題である.外部知識を利用せずにモデルの入出力インタフェースのみを利用し,サンプリングベースで幻覚検出を行う手法にSelfCheckGPTがある.SelfCheckGPTではサンプリングを行う際にLLMの温度パラメタを上昇させる必要があるが,Web版のChatGPTのようにLLMサービスの中には温度パラメタを設定できないものも存在する.特に正確な応答をするよう設計されたLLMサービスでは,その温度が低温度に固定される可能性があるため,SelfCheckGPTの性能が悪化する可能性がある.本研究では,低温度固定状況下における幻覚検出の性能を改善するため,サンプリング時にプロンプトに対してランダム文字列の追加もしくは逆翻訳によるデータ拡張を施す手法を提案し,日本語LLMを対象に実験した.その結果,低温度固定状況下でSelfCheckGPTより良い性能を発揮することが分かった.

  • 宮川 舜右, 竹内 勇剛
    セッションID: 4Xin2-67
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    人は他者と会話をする際に相互に言葉を発したり聞いたりし,会話を成立させている.その際に,参与者は相互理解を目的としている.そういった会話には,互いに不完全な発話をし互いに補完しあったりオーバーラップ的に発話をしたりするものがある.このようなコミュニケーションを共話とする.本研究では,共話が共通基盤の形成および更新がされやすいコミュニケーションスタイルなのかを分析した.共同図形配置課題およびキーワード生成課題を行うことで,共通基盤がより形成されたペアとその他の群で共話の回数や頻度の差があるかを調べ,共話と共通基盤の形成および更新の関連性を検討した.その結果,共話の発生頻度が高いペアにおいて図形配置が一致しやすい可能性が示唆された.また,言い換え型の共話が相互理解の形成段階で多く見られた.現行のスマートスピーカーをはじめとしたエージェントとの会話はRequest/Response 形式で取られることが多いが,本研究により共話と共通基盤の形成の関係性が判明することで,エージェントとのコミュニケーションの多様化に貢献できることを期待する.

  • 鈴木 理矩, 中村 篤祥
    セッションID: 4Xin2-68
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    多目的閾値バンディット問題は,与えられたK個の腕集合の中から、各時刻に1腕選び多値の報酬を得ることを繰り返し、全ての優良腕を同定することを目的としている.ここで,優良腕とは全ての評価指標において、全ての次元の期待報酬が共に与えられた閾値以上である腕のことを指す.固定信頼度の設定において,この問題において漸近的下界を達成する最適な各腕を引く割合を示し,停止条件に使われる一般化尤度比統計量の式を示す.それらと事後分布サンプリングに基づくアルゴリズムP-Trackingをこの問題に適用する.また,P-Trackingアルゴリズムの有効性について人工データを用いて検証する.多次元報酬の閾値バンディット問題において事後分布サンプリングではなく,強制探索により期待報酬推定の補正を行うC-TrackingとD-Trackingに加え,一次元報酬の閾値バンディット問題において有効なHDoCの単純な二次元拡張版との実験による比較では,P-Trackingが平均的により少ない報酬サンプルから閾値以上の腕の集合の同定を行うことが確認できた.

  • 浅野 優, 今一 修, 横手 健一
    セッションID: 4Xin2-69
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本稿では文書検索のための聞き返し機能について述べる.利用者が不慣れな分野で文書検索をする場合,適切なキーワードやタグが分からないことがある.このような場合,利用者が目的とする文書を明確化するために,システムが利用者に聞き返すことができれば,利用者は目的の文書に効率的に辿り着くことができる.本論文では,利用者の検索意図を明確化するために,文書に付与されたタグを拡張した情報に基づき,検索対象を絞り込む質問と検索対象を拡張する質問を聞き返す機能を有する文書検索システムを提案する.本システムを実装し,公共分野のユースケースにおいて,既存のタグ検索と比較することで、提案手法の有効性を評価した.

  • 柳 凜太郎, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀
    セッションID: 4Xin2-70
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    ゴム材料の物性推定は,ゴム材料開発の高度化・高速化において必要不可欠であり,様々な推定手法が提案されている.従来の物性推定手法は,主にゴム材料を製造する際の配合材料の差異が物性値へ与える影響に着目して構築されてきた.一方で,実際のゴム材料の物性は,配合材料のみならず,製造過程における工程要因や,気温や湿度等の環境要因にも影響されると考えられる.したがって,高品質なゴム材料を持続的に製造するためには,工程要因や環境要因が物性値に与える影響を解明する必要がある.そこで,本文では,ゴム材料の製造過程で得られる工場センサの情報(工程要因)や気温・湿度等の天候情報(環境要因)が物性値に与える影響を解析する.具体的に,工程要因および環境要因を説明変数として物性推定を行い,説明変数が物性推定に与える影響を解析することが可能な回帰手法を構築する.また,本文では実験において,気温や湿度等の環境要因が物性値に影響を与えることを明らかにしている.これらの解析により,高品質なゴム材料を製造するために重視すべき要因の特定へ貢献可能になると期待される.

  • 石山 隼, 藤原 大悟, 片島 健博, 泉谷 知範
    セッションID: 4Xin2-71
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    工場の定期修理のように、1系列の観察データ上で低頻度の介入が繰り返し行われる場合に効果を推定する方法を提案する。 定期修理のような介入は繰り返し行われるため、これを利用して1系列の観察データ上で介入効果を推定する方法を提案する。1系列の観察データにおける介入効果推定手法の1つとして、介入前のデータから予想されるトレンドによって推定された反実仮想を利用する分割時系列デザイン(Interrupted Time Series Analysis: ITSA)が提案されている。ITSAを用いて複数回の介入効果を推定する場合、大域的な非線形性の問題や、個々の介入ごとに異なる推定値からの知見が得られにくいという課題がある。提案手法では、介入前後の限られた区間でモデルを作成し、大域的な非線形性を、線形な介入の効果として近似できることが期待でき、加えて個々の介入の効果を一貫して取り扱い、推定を安定させることを目的とする。人工データによる実験を行い、手法の妥当性を検証した。その結果、複数の介入に同質性を仮定でき、まとめて扱うときには提案手法が有効であり、使用する際には、区間の選択が重要であることがわかった。

  • 菅原 滋
    セッションID: 4Xin2-72
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    タブレットで書かれたオンライン筆跡が、どの程度の精度で識別できるのかを検証している。文字の形ではなく、筆速や筆圧など、オンラインでのみ測定できる指標を用いて筆者の識別を試みた。各文字の字画数が識別率に影響を与えるか否かを検証した。筆跡データは、筆跡標本2019の中から、ランダムに様々な字画数の文字を20文字選択し使用した(401人、5回/人、400pixel ×400pixel×3)。字画数が2から15までの文字を選択した。各文字について7つの指標(ストローク数、筆記時間、筆記速度、最大筆圧、平均筆圧、筆圧の縦横比、筆速の縦横比)を計算し、筆者毎に平均値と標準偏差を計算した。そして筆者間の平均値の差を標準偏差で正規化した値を用いて、筆者を識別し、どの程度の識別率が得られるかを計算した。その結果、文字の字画数が多いほど、筆者の識別率が高くなる傾向が見られた。

  • 土坂 祐太郎, 髙木 洋和, 杉森 文亮, 林 千春, 手島 哲平, 森田 克明
    セッションID: 4Xin2-73
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    電力自由化やカーボンニュートラル社会に向けたエネルギー環境の変化を受け、大規模工場では、設備稼働や操業に必要な電力・熱等のエネルギーを効率的に運用する必要がある。工場でのエネルギー需要は刻一刻と変動する各種設備の稼働状況や気象条件等により左右されるため、それら条件の元に将来の需要を高精度に予測する手法が求められる。近年では、深層学習の分野においてTransformerベースの手法を始めとして種々の時系列予測手法が提案されており、エネルギー需要予測に適用することで、高精度化が期待できる。しかし、深層学習モデルはBlack Boxモデルであることから、予測根拠が不明となり、何の因子が予測結果に影響するかの説明性が重要となっている。そこで、本研究では、工場の電力需要予測を題材として、深層学習時系列モデルに対して適用可能なXAI技術として、モデル全体の振る舞いを示す大局的手法TIMEによりモデルの説明性と性能を両立したモデルの構築を試みた。その結果、大局的手法 (TIME)で抽出した特徴量で予測モデルを再構築することで、説明性および性能改善の両立が図れることを示した。

  • 中村 彰成, 高橋 達二, 高野 毅, 馬目 信人, 篠原 修二
    セッションID: 4Xin2-74
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年,リモートミーティングの普及に伴い,音声主体のコミュニケーションの重要性が高まっている.特に視覚情報が制限された環境では,相手の感情を読み取るのは困難である.このような背景の中で,音声に基づいた感情の認識と分析は,コミュニケーションの質を高める上で極めて重要である.そこで,コミュニケーションの質を高めるために,音声感情認識システムを用いて対話データの分析を行った. これまで我々は, Mehrabian と Russell によって提案された Valence - Arousal - Dominance モデルを用いて構築された音声感情認識システムを開発してきた.本研究では,宇都宮大学パラ言語情報研究向け音声対話データベースを使用し,人間による感情の評価と,音声感情認識システムによる感情の推定値を比較した.対話者間の感情の関係を深く理解するため,相互相関分析と対話者間の感情の時間遅れに関する調査を行った.この分析を通じて,対話者間の感情の動態を捉え,感情の相関が時間の経過と共に徐々に弱まることが示唆された.

  • 薛 強, 滝口 哲也, 有木 康雄
    セッションID: 4Xin2-75
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    対話システムの発展において、適切な応答を生成し、不適切な応答を抑制することは重要な課題である。本研究では、対照学習の枠組みを拡張し、負例の生成確率を間接的に調整する新たな手法を提案する。この手法は、特定の「Bad Token」を用いることで、対話システムにおける不適切な応答の生成確率を効果的に抑制する。従来の直接的な負例最小化戦略と異なり、この間接的なアプローチは、負例の生成確率に影響を与える新たな可能性を対話システムに提供する。実験結果は、この方法が従来の対照学習と同等の効果を達成しており、対話システムの負例制御における新たな展望を開くことを示している。

  • 井島 大弥, 刑部 好弘, 高瀬 諒一, 小山 光, 淺原 彰規
    セッションID: 4Xin2-76
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    機能性タンパク質の開発効率向上のため、有望なタンパク質候補をアミノ酸配列生成モデルに提案させる試みが広がっている。しかし、生成モデルが出力する、既知配列に類似した配列は性能において必ずしも有望であるとは限らない。本研究では配列の類似性だけでなく性能の類似性も同時に学習させる生成手法を提案する。本手法は潜在変数の1成分がタンパク質の性能と相関するように学習させたVariational Autoencoderを用いて、既知のタンパク質アミノ酸配列から性能が高まるよう外挿した変異タンパク質アミノ酸配列を生成する。タンパク質の性能予測モデルを用いた模擬的な評価によって、本手法の実験候補タンパク質設計における開発効率向上効果を確認した。

  • 柴田 健一
    セッションID: 4Xin2-77
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    社会人の学び直しとも言われるリカレント教育では,年齢や立場を超えた多様な属性の学習者同士による協調学習が活発化しており,社会人を対象としたオンライン学習支援の場が広がりつつある.本研究ではリカレント教育の現場にてグラフ文書を用いたオンライン学習環境の有効性を評価した.グラフ文書の作成と共同学習をオンラインで行うために,筆者らが開発するグラフ文書共同作成支援ツールとWeb会議サービスを組み合わせたオンライン学習環境を構築し,社会人を対象に評価実験を行った.結果,オンライングループワークにグラフ文書を用いることでテキスト文書よりもディスカッションの質向上に有効である見通しを得た.

  • 姜 菁菁, 郭 傲, 東中 竜一郎
    セッションID: 4Xin2-78
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    対話システムがユーザの状態を的確に把握し応答するためには,発話のみから得られる情報だけでなく,多様なセンサから得られるマルチモーダル情報の利用が望ましい.そこで,本研究では,多様なセンサから得られるマルチモーダル情報を活用する対話システムの実現に向けた対話データを収集した.具体的には,複数のセンサを使用し,対話における音声,映像,生体情報,視線情報,動作情報などのデータを収集した.また,各対話が終了した直後に,話者本人が,対話中の映像を見ながら,自身の心象についての主観評価を行った.本稿では,対話データの収集およびセンサ情報と主観評価の関係分析の結果について述べる.

  • 小嶋 陽平, 小野 ゆり子, ナート ピンク, 吉岡 真治
    セッションID: 4Xin2-79
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年の計算化学では,化学反応の詳細なプロセスを計算で求める人工力誘起反応法(AFIR法)などの手法が開発されている.しかし,この手法から得られる化学反応プロセスの計算結果は,情報の粒度が細かく可読性が低い.本研究では,論文等において化学反応のプロセスの説明に用いられる「素反応」と呼ばれる複雑な化学反応を構成する単純な化学反応を用いて,化学反応プロセスの結果を解釈できるシステムを提案する.素反応を含む化学反応のオントロジーとしてはRXNOなどが存在するが,その知識は記述的なものが多く,化学反応プロセスの自動的な解釈には不十分である.そこで本研究では,素反応の反応の前後における分子の構造パターンの変化の記述を中心とした,素反応に関する新たな知識ベースの枠組みを提案する.また,この知識ベースに基づいて化学反応プロセスの解釈を行う方法を検討し,実際の計算結果を用いた検証を行った.

  • 友清 雄太, 三浦 崇寛, 東出 紀之, 浅谷 公威, 坂田 一郎
    セッションID: 4Xin2-80
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    研究者のキャリアの中には、ホットストリークと呼ばれる、通常よりも特別な成果が連続する成功期が存在することが知られている。[Liu 18]らは、連続的な成功を捉えるhot-streak modelを提案しているが、移動平均を用いた成績の時系列データを集約し、最適化手法を用いて区分関数でフィッティングしたモデルであり、必ずしも厳密な連続的成功を捉えている保証はない。ホットストリークは研究者のキャリアにおける創造性と生産性の突出した期間を示す重要な指標になり得る。この期間が起こる背景に踏み込むことは研究コミュニティや科学技術政策などに有効な知見の提供に繋がる。これらの根幹となるhot-streak modelの頑健性を検証することは有意義である。検証の結果、hot-streak modelは移動平均と研究者の潜在能力の上昇を仮定してデータを解釈する2点において、数本の並はずれた単発の成功があってもホットストリークとみなしてしまうことが分かった。ホットストリークの検出には、本研究の検証で使用した論文の被引用数で観測される連続成功に焦点を当てたモデルとの併用などの工夫が必要であることが示唆された。

  • 永塚 光一, 十河 泰弘
    セッションID: 4Xin2-81
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデルによって生成されたテキストを高い精度で検出することは,LLMによる誤情報の拡散や悪用を防ぐ上で非常に重要である.近年,LLM由来のテキストを検出する技術の一つとして,言語モデルの自己回帰生成プロセスに着目した電子透かしが注目されている.この手法では,単一の鍵に基づき選ばれた一部のトークンの生成確率に補正を加えることで,特定のトークン出現パターンを透かしとしてテキストに埋め込む.従来手法は,高い精度でテキストの生成元を判別できる一方で,単一の鍵が漏洩した場合にテキストの検出が困難になるという課題がある.本稿では,こうした鍵漏洩時の脆弱性を緩和するために,新たに二重電子透かしを提案する.提案手法では,二つの異なる鍵を用いて二重に透かしを埋め込むことにより,一方の鍵が漏洩した場合におけるテキストの検出を可能にする.指示データセットを用いた実験により,提案手法がテキストの質を大きく低下させることなく,高い精度で二つの透かしを検出できることを示した.

  • 角掛 正弥, 是枝 祐太, 丹羽 雄平, 浦野 真穂, 十河 泰弘
    セッションID: 4Xin2-82
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    企業経営において、営業活動は重要な役割を担う。営業活動にて安定して受注を獲得していくには、効率的な営業活動管理の仕組みが求められる。そのため、営業データを一元的に収集・管理する営業支援システム(SFA)が普及している。しかし、活動内容の詳細は自由記述式のテキストデータで記されることも多く、膨大なテキストデータから営業活動の全体像を把握するには時間と労力を要する状況にある。本論文では、効率的な営業活動管理の支援を目指し、営業活動の内容が記されたテキストデータから営業員または顧客の行動を検出し可視化するアプリケーションの一形態を提示する。実際の営業データを用いた実験を通して、可視化アプリケーションの実現可能性や有用性を確認した。

  • 北澤 正樹, 高橋 聡, 吉川 厚
    セッションID: 4Xin2-83
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究ではエージェントベース感染症シミュレータとベイズ最適化を組み合わせたバックアップ実施ポリシー探索システムを構築した.本システムは感染発生時の生産現場において,感染者数とバックアップ作業者数の合計を最小化するバックアップ実施ポリシーを提供する.バックアップ実施ポリシーとは,感染の発症者が確認された際に発症者と周辺作業者の欠席範囲を指定してバックアップ範囲を調整するものである.感染者数に対してバックアップ範囲が狭すぎると感染が収まらず,逆に広すぎると余分な人員が必要になるため,感染状況に合わせて適切に設定することが重要である.構築システムで12の異なるシナリオのポリシー探索を行い,以下の3点を得た:1)構築システムは探索により,マスク未着用のインフルエンザ流行時といった特定シナリオに対して,公衆衛生戦略に類似したポリシーを提供できた,2)一部シナリオでは全期間で単一のポリシーを使用することが最適である可能性が示された,3)工場規模やマスク着用率やウイルス種類に応じて適したバックアップ実施ポリシーは異なる.そのため,発症者が原因ウイルスを迅速に特定して対策に活かすことも重要である.

  • 鈴木 希望, 吉岡 真治
    セッションID: 4Xin2-84
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    Wikipediaには、様々な事物に関するデータが記述されているが、知識工学的な観点からは構造化されていない。多くのWikipediaからの構造化手法では、主に、記事のクラス分類とその属性付与という形での構造化が行われている。Wikipediaカテゴリはこの記事のクラス分類に貢献することが期待されるが、様々な目的でカテゴリが付与されるため、クラス分類に適切なカテゴリのみに絞り込むことは容易ではない。一方、機械学習の方法では、定義文などに注目したクラス推定の手法が提案されているものの、クラスごとにその性能が大きく異なっている。本研究では、人間が付与したデータであるカテゴリと、各記事の主題を定義する定義文を組み合わせたクラス分類の手法を提案する。具体的には、定型的に記述されることの多い定義文から、クラスを代表するような単語・句(定義語)を抽出する方法を提案し、カテゴリと組み合わせることでクラス推定を行う。また、本手法を「森羅プロジェクト」のクラス分類タスクに適用した結果について報告する。

  • 高田 雄太, 戸田 貴久
    セッションID: 4Xin2-85
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    人狼知能の研究では,だましたり,見破ったり,説得したりといった行為をあたかも人間がやるかのように模倣する知的エージェントの実現が大きな目標の1つである.本研究では,他のエージェント の発言や行動,あるいは,人狼ゲームのレギュレーションに論理的に矛盾しないようなふるまいをするエージェントを実現するための実践的な枠組みの開発を目的にする. この目的に向けて,本研究では不確実な信念を持つエージェントの論理モデルを考案する. さらに,そのような論理モデルの下で記述した知識をもとにして不確実な事象に対する推論手法を考案する.また,これらの課題点について議論する.

  • 小原 有以, 相馬 菜生, 梶浦 照乃, 倉光 君郎
    セッションID: 4Xin2-86
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデル(LLM)は様々な業界に革新をもたらしている.その動きの中,特定のドメイン知識を持つドメインに特化したLLMを開発する動きが進められている.そのようなLLMの活用で,ドメインタスクの効率を向上させることが期待されている.特定ドメインに特化したLLMを構築するためには,対象ドメインに関連する大規模なコーパスが不可欠である.しかし,そのようなコーパスの収集は困難であり,時間とリソースが限られている研究環境において,顕著な課題となる.本研究の目的は,ドメインに関連するコーパスを効率的に構築する手法を開発することである.この目的のもと,我々は,ドメインサンプリングという手法を提案する.SentencePieceを用いてドメインの専門用語を多く含む語彙モデルを構築し,トークン化の結果に基づいてドメインに関連するコーパスをサンプリングする手法である.本手法を用いてコードに関連するコーパスを構築し,それを事前学習に用いて日本語対応の軽量コードLLMの構築を行なった.本手法で収集したコーパスをコードLLM学習に用いることで,日本語からのコード生成能力が向上したことを報告する.

  • 古瀬 民生, 山田 郁子, 西村 静, 串田 知子, 田村 勝
    セッションID: 4Xin2-87
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    生命科学分野の研究において再現性がある確かな研究を行うためには、高品質の実験材料(バイオリソース)の使用が不可欠である。理化学研究所バイオリソース研究センター(理研BRC)では、遺伝子改変マウス含む様々なバイオリソースの収集・提供を行なっている。また、マウスを用いた疾患モデル解析、遺伝子機能解析では、マウスリソース自体に加え、付随する表現型情報も重要な研究基盤となる。そこで我々は、マウスの網羅的表現型解析プラットフォームを開発し、マウスリソースに表現型情報を付加している。これまで我々は、表現型解析に実験装置付属の市販ソフトウェアを用いてきた。これら市販ソフトウェアは、GUIによる簡易な操作体系などによりハイスループットな解析を可能にしてきたが、汎用性、拡張性、アップデートのためのコストなどにおいての課題が存在する。その一方、研究コミュニティにおいては機械学習などAI技術を用いたオープンソースソフトウェアが利用可能となっている。本大会において我々は、先に述べた市販ソフトウェアの持つ課題に対処するために行なっているオープンソースソフトウェアの実装について報告する。

  • 小島 亮一, 南川 敦宣
    セッションID: 4Xin2-88
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    Large Language Models (LLM)に加えLarge Multimodal Models (LMM)においてもInstruction Tuningによる未知タスクのzero shot, few shot 性能向上が徐々に報告されつつある。これらの研究が主に多様なベンチマークに対する汎用的なものであるのに対し、我々は未来交通量予測にフォーカスして研究している。具体的には、地図上にオーバーレイされた交通量ヒートマップを日時、緯度・経度、カラーバーでよりリッチな画像にしてInstruction Tuningすることによるラッシュアワーなど特定の時間帯や週末の交通量予測について報告する。

  • 本武 陽一
    セッションID: 4Xin2-89
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    複雑な物理系の縮小モデルを開発する科学者を支援するために、物理系の時系列データに対して学習させたディープニューラルネットワーク(DNN)から解釈可能な物理情報を抽出する手法を提案する。具体的には、有限自由度の古典ハミルトニアン力学系とみなすことができる時系列データに対して学習させたDNNから、系の隠れた非線形対称性を推定する枠組みを提案する。提案するフレームワークは、惑星の楕円運動の長軸方向を一定に保つ保存値であるラプラス--ルンゲ--レンツベクトルに対応する非線形対称性を推定し、そのLie多様体を可視化することができる。

  • 中野 由加子, 小林 一郎
    セッションID: 4Xin2-90
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    Data-to-Textは表や時系列チャートなど多様な表現形式での数値データにおける重要な部分を抽出した説明文生成を行う研究であり,人々のデータへの理解を助ける.Data-to-Textの研究のうち,時系列データを対象として動向などの数値解析結果についての説明文生成を行う研究は,著者らが知る限り一つの時系列データを扱う.一つではなく二つの時系列データを対象とすることで,比較結果などより多くの情報について説明が可能になる.本研究は二つの時系列データの比較結果を説明する手法を提案する.データセットを3つ作成しTransformerをベースとした提案モデルの訓練を行なった.作成したデータセットを用いて,訓練を段階的に行う手法と段階的に行わない手法を比較し精度の比較を行なった.生成結果から段階的に訓練を行うことが精度の向上につながることが確認された

  • 結城 喬, 上田 直生也, 岡 照晃, 小町 守
    セッションID: 4Xin2-91
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年、深層学習による俳句生成や評価が注目されている。俳句生成についての先行研究は存在する一方で、俳句評価は手間がかかり、俳句評価の質は評価者やタイミングによって変わり得る。GPTのような大量の事前学習データとモデルのパラメータ数を持つ大規模言語モデルは、既存の言語モデルより正確に俳句を評価すると期待される。そこで、本研究では、GPTによる俳句の自動評価に取り組む。目的は、俳句評価の工数削減と均質化のための大規模言語モデルによる俳句評価の自動化である。実験の結果、GPT は few-shot learning によって俳句評価を学習でき、またGPT-4はGPT-3.5-turboより正確に俳句評価を実行できると判明した。

  • 天野 祥太朗, 中川 智皓, 内藤 昭一, 井之上 直也, 山口 健史, 尾崎 大晟, 新谷 篤彦
    セッションID: 4Xin2-92
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    批判的思考力の育成には議論に対して複数のフィードバックを行うことが有効であり,学習者が作成した論述に対して自動で反論を与えることを考える. 大規模言語モデルにより,流暢な文生成が可能となったが,生成内容を論理構造レベルで制御できるかは十分な検証がされていない.生成する反論を制御できれば、事前に用意した論理構造に基づき網羅的または特定の観点に焦点を当てた反論を意図的に与えることができる.本研究では,GPT-3.5に論理構造を表すテンプレートを与えて反論を生成した場合,指示通りの反論が生成できるのかを検証する. オンラインディベートプラットフォームと即興型英語ディベートの過去問から議題と立論を収集し,テンプレートの意図通りに反論文が生成されているかの評価を行った. 指定したテンプレート通りに生成できたが,論理構造が複雑なテンプレートではスコアが低い.それを踏まえても,議題ごとのスコアは高く,テンプレートの意図に沿った反論文を生成することができていた. 本研究は,GPT-3.5を使用しての多様な反論文の生成に貢献する可能性を報告するものであり,教育応用への実用性を調査する一助となることを期待する.

  • 上田 将矢, 竹谷 謙吾, 岡本 憲卓, 菊入 圭
    セッションID: 4Xin2-93
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    ビジネス会議では,異言語話者間で情報交換が行われることがある.このような状況での円滑なコミュニケーションを促進するため,話し言葉を対象とした機械翻訳(MachineTranslation, MT)のニーズが高まっている。話し言葉は指示代名詞や省略表現が多い,固有名詞や固有表現が多いといった傾向があるため, 話の流れ(文脈情報) を考慮して翻訳(文脈翻訳)を行う必要がある.本研究では,ビジネス会議を想定し,日 ↔ 英の翻訳を対象に,大規模言語モデル (Large Language Model, LLM)を用いた文脈翻訳についての研究を行う.実際の会議に即した評価を行うため,我々は実際の会議音声データの書き起こしと対訳を行い、データセットを作成した.またプロンプトに効果的な文脈情報を含めるため,原言語文の意味類似度と共参照解析を活用した文脈文選択手法を提案する。自動評価指標を用いた評価の結果,英 → 日、日→英方向で異なる手法による訳質改善を確認した.

  • 吉田 快, 河野 誠也, 吉野 幸一郎
    セッションID: 4Xin2-94
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    対話システムが適切にユーザの趣向に沿った応答をしようとする場合、対話の文脈に対して自然な応答を行うだけでなく、よりユーザが関心を持つ話題へと自然に話題を遷移・転換する能力が必要である。 そこで本研究では、語連想を大規模言語モデルに行わせることによって、現在の話題から目的の話題へと遷移することのできる話題遷移グラフを構築する枠組みとその評価指標を提案する。 そして、提案手法と知識グラフ上の経路探索を用いた話題遷移手法を比較評価し、より良い話題遷移手法について分析を行った。

  • 中渡瀬 秀一
    セッションID: 4Xin2-95
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデル技術の発展により、対話型生成AIが自然言語プロンプトに応答する能力を持つようになった。これらのAIは、質問への回答生成、文書の内容認識、要約、情報抽出などのタスクを実行できる。しかし、最適なプロンプト設計に関する理論は未確立であり、効果的なプロンプト技法に関する研究が行われている。本研究では、引用文献抽出タスクにおいて、これらの技法の有効性を検証した。実験では、異なるレイアウトと文献フォーマットを持つ日本語論文3篇を使用し、ChatGPT(GPT-4)を利用した。実験の結果、横書きレイアウトでは単純なプロンプトで正確な文献抽出が可能であったが、縦書き2段組の注形式では限定的な改善に留まり、プロンプト改良の効果は一部の技法に限られた。

  • 個別フィードバックを実現するための生理情報と性格特性を用いた詐欺被害リスク推定モデルの構築
    池田 妃那, 井手 健太, 近野 恵, 吉野 航平, 紺野 剛史, 桐生 正幸
    セッションID: 4Xin2-96
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    日本国内において特殊詐欺被害は増加傾向にあり,社会課題のひとつとなっている.我々は,詐欺被害を減らすにはひとりひとりが当事者意識を持つことが重要であると考え,特殊詐欺の会話を体験できる機能と体験後に潜在的な詐欺被害リスクをフィードバックできる機能を備えた,特殊詐欺訓練AIツールを開発している.先行研究として,潜在的な詐欺被害リスクを推定するAIモデルに関連した研究は少ない.そこで本研究は,体験者毎の個別フィードバックに対応することができる,潜在的な詐欺被害リスクを推定するAIモデルの構築を目的とする.特徴量として,非接触センサで取得する訓練中の生理情報(脈拍,呼吸)や体験者の基本情報を使用することに加えて,騙されやすさは性格と関係があると考え,体験者の性格特性(Big Five)も使用してモデルを構築した.高齢者29名のデータを用いて評価した結果,特徴量に生理情報や基本情報だけを用いた場合に比べ,性格特性を加えることでより高精度なモデルを構築することができ,個別フィードバックが可能となった.今後は,自治体向けの特殊詐欺訓練でツールの検証を行い,有効性を確認していく.

  • 歴史文化知の表現を題材として
    亀田 尭宙
    セッションID: 4Xin2-97
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本論文では、知識グラフによる人文社会学的知識の表現について、URIがどのように現実のものを指し示すかといった根本的な部分まで立ち返って議論を整理する。例として、著者がこれまで構築してきた歴史や文化財、デジタルアーカイブに関わるデータを用い、知識グラフとして記述するときにどのように知識を整理すれば良いか、それによって何が可能になるかを述べる。これらの議論とモデルによって、これまで困難と考えられてきた知識グラフによる人文社会学的知識の表現にも着手しやすくなることが期待される。

  • 小柳 響子, 佐藤 美唯, 梶浦 照乃, 倉光 君郎
    セッションID: 4Xin2-98
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデル(LLM)の構築に使用される大量の事前学習データの中には,著作権で保護されたテキストや,個人情報など,学習に不適切なデータが含まれている可能性がある.LLMの構築に使用した具体的な学習データは明示されないことが多いため、事前学習データを検知する手法が重要になる. 既存の検知手法として、入力テキストの内,予測確率の低いトークンを用いて学習の有無を判定する方法があるが,評価対象は,英語を中心に学習したLLMであり,日本語を中心に学習したLLMでの有効性は調査されていない. 本研究の目的は,日本語LLMにおける既存の検知手法の有効性を評価し,英語LLMでの有効性と比較することである.そのために,我々は日本語の事前学習データにおいて検知手法の評価を行うためのベンチマークJAWikiMIAを構築した. 実験の結果,学習の有無を判定する際,英語LLMでは,入力テキストのうち予測確率が下位20%のトークンの平均対数尤度を用いると検知精度が高くなる一方で,日本語LLMでは,全てのトークンの平均対数尤度を用いた方が検知精度が高くなることが明らかとなった.

  • 松木 萌, 上村 拓也, 烏谷 彰, 渡辺 一郎
    セッションID: 4Xin2-99
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    健康増進や学習といった対象者にとって望ましい行動変容や行動の継続を支援するサービスの実現に向けて,対象者が無理なく実施できる時間帯を予測する将来行動予測モデルを提案する.対象者が新たな行動を無理なく実施できる時間帯とは,予定や日常的に行われる睡眠や食事などの行動が発生する確率が低い時間帯であると仮定する.このとき予定や日常行動は日々実施される時間帯が変化し,さらに疲労度などでそれらの行動の長さは変化するため,事前に計画されたスケジュールから統計的に予測する従来手法では予測することはできない.そこで,予定や日常行動,疲労の3つ要素を考慮して,対象者が新たな行動を無理なく実施できる時間帯を予測するEncoder-Decoderモデルを提案する.我々は2つのデータセットを用いて提案モデルを評価した結果,統計的な手法より精度が高く日常の変化に応じた予測ができていることを確認した.

feedback
Top