人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
選択された号の論文の939件中851~900を表示しています
  • Parameshwor ROKAHA, Junya MORITA
    セッションID: 4Xin2-115
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    An essential component of human cognition, memories, help to shape who we are and how we make decisions. Reminiscence is an act of remembering and recalling past experiences or moments. This study combines a personal photo as a store of memory contents and the Adaptive Control of Thought-Rational (ACT-R) model for simulating memory recall. Based on this idea, previous studies have integrated emotion recognition from speech into a cognitive model. This study focuses on to improving parameter settings and expanding the method into users countries outside Japan.

  • 松永 沙織, 吉村 玄太
    セッションID: 4Xin2-116
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    機械学習モデルの推論は帰納法的でかつ一般に複雑なブラックボックスであるため従来のソフトウェアテスト手法を適用することが難しく、機械学習ソフトウェアに適したテスト手法が必要である。本研究では決定木アンサンブルモデルを対象として、期待する検証性質をモデルが満たすか否かを厳密に検証し、検証結果を要約して提示可能な形式検証手法を提案する。提案手法は、検証性質の入力領域を効率的に探索することで検証違反を網羅的に列挙し、違反に人が適切に対処できるように違反領域を要約して提示する。回帰・二値分類・多クラス分類の3タスクを含む4データセットで実験した結果、提案手法は従来手法よりもはるかに高速に検証を完了できることを確認した。また、提示した違反領域の良し悪しを定量化するために提案した評価指標を比較した結果、提案手法が従来手法よりも質の高い違反領域を提示できることが分かった。

  • 近藤 里咲, 寺面 杏優, 梶川 怜恩, 堀口 航輝, 梶原 智之, 二宮 崇, 早志 英朗, 中島 悠太, 長原 一
    セッションID: 4Xin2-12
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究では,日本語のSNS投稿テキストを対象とする感情極性分類に取り組む.SNSから収集されたテキストには,発音の崩れや誤字脱字をはじめとする日本語の表記の崩れや,ネットスラングのようなSNS特有の造語など,様々なノイズが含まれる.このようなテキストの多様性が感情分析モデルの性能に悪影響を及ぼす可能性があるため,本研究ではテキスト正規化によって感情分析の性能改善を試みる.さらに,同義語集合の高頻度な表現への統一,誤字脱字の修正,常体敬体などの文末表現の統一など,テキスト正規化に含まれる様々な編集操作について詳細に分析し,どの種類の正規化が感情分析の性能改善に貢献するのかを明らかにする.SNS投稿テキストを対象とするWRIMEコーパスにおける感情極性分類の評価実験の結果,テキスト正規化によって日本語感情分析の性能を改善できることを確認した.

  • 森村 哲郎, 坂本 充生
    セッションID: 4Xin2-13
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデル(LLM)のファインチューニングには,人間のフィードバックからの強化学習(RLHF)が広く用いられている.しかし,RLHFでは報酬モデルの学習を行うが,一般に推定誤差が残るため,報酬モデルへの過剰適応が問題になる.これはRLHFの適用を困難にする要因となっている.本研究では,この問題に対処するため,多様な報酬モデルを複数作成し、報酬の評価を悲観的に行うアプローチを提案する.具体的には,報酬モデル間の出力のばらつきから,報酬計算の確信度を評価し,確信度が低いときには悲観的に報酬を評価する.アプローチの有効性を実験的に検証する.

  • 軍司 健太, 大野 和則, 栗田 修平, 櫻田 健, 岡田 佳都, 田所 諭
    セッションID: 4Xin2-14
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    人間作業空間を動作するロボットにとって、空間内の物体の共起性や、連想される場所概念の情報は重要である。近年ChatGPTを初めとする大規模言語モデルは物体の共起性に関する知識を保有し、対話の中で物体同士の共起性の情報を引き出すことができる。しかし、LLMが出す共起性の答えの妥当性について未検証である。そこでセマンティクスラベルのついた空間データセットをもちいてLLMが出した答えの正確さ、一般性を評価する。本稿では空間データセットにおける物体同士の位置情報から共起性の有無を判定し、共起度の算出を行う。ChatGPTに対して空間データセットの情報を事前情報として与えた後に物体同士の共起度について質問をすることで共起度の答えを得る両者の共起度を比較することで、ChatGPTの出力する物体共起度情報の妥当性を検証する。

  • 吉井 健敏, 持橋 大地
    セッションID: 4Xin2-15
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    インターネット上にはブログやネットニュース、動画など様々なコンテンツで溢れている。メディアはそれらの視聴数に応じた収益を獲得するため、できるだけ多くの視聴数を稼げる戦略を常に探求している。一方で視聴者は日々のスケジュールに沿った活動をし、時間帯にあったインターネットの利用をしているため、必然とコンテンツには時間的な特性が生じる。この時間特性を明らかにすることはメディアの配信するタイミング戦略に大きく貢献することが期待される。本研究ではWikipediaで公開されている記事の閲覧数の履歴を利用して、それぞれの記事やユーザが持つ時間的性質を明らかにする2つの手法を提案する。まず記事の概要に自然言語処理を経て画一的なジャンルを付与し特定の時間に人気のジャンルを抽出できることを示し、次に記事の時間別閲覧傾向に独立成分分析を施しユーザグループの時間特性を明らかにする。

  • 大島 将, 岡本 有司, 原田 陽平, 鎌田 真由美, 奥野 恭史
    セッションID: 4Xin2-16
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    個別化医療に向けて、遺伝子変異に基づくがんの治療薬の設計が行われている。治療の標的となる遺伝子の候補が膨大であるため、遺伝子制御ネットワークベースの治療薬設計に変化しつつある。現在では、「マスターレギュレーター」と呼ばれる遺伝子制御ネットワークにおける中心的な遺伝子の抽出ががん治療薬設計の重要な課題となっている。しかしながら、マスターレギュレーターには明確な基準は存在せず、これまでの同定方法は遺伝子制御ネットワークの構造情報を十分に活用していない。そこで本研究では、個別の患者に与えられる遺伝子制御ネットワークに対する、新しいマスターレギュレーター推定法を提案する。提案手法は、グラフニューラルネットワークによって構成されるグラフ間の距離を用いているため、遺伝子制御ネットワークの構造情報を利用したマスターレギュレーターの推定が可能となる。さらに、生存時間解析やがん疾患との関連性との照合を行うことにより、本手法の有用性と妥当性を示す。これにより、より効果的ながん治療薬の設計が可能となり、個々の患者に最適な治療戦略の開発に寄与することが期待される。

  • 春日 優虎, 浦野 昌一
    セッションID: 4Xin2-17
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大学入学共通テストにおいて記述式問題の導入が検討されるなど, 学生の思考力を問うべく記述式問題への需要が高まっている. その際の採点コストを抑えるため, 自然言語処理の手法を用いて自動採点モデルを構築する先行研究は多くあるものの, 高精度なモデルを構築するためには大規模なデータセットを構築する必要があり, 実際の採点の現場を想定した際の実現可能性が低いという現状がある. 本研究では日本語で記述された解答のデータセットを英語訳して得られた英語データセットをBack Translation(逆翻訳)の手法を用いてデータセット拡張を行う. そして, そのようにして得られたデータセットを用いてBERTの英語事前学習モデルをファインチューニングすることで, 解答の文意を反映させた分散表現を出力できる状態を目指す. 最後に, 分散表現を入力して得点を出力する分類器を構築することで, 小規模データセットから高精度な記述式問題の自動採点モデルを構築することを考えた.

  • 菊谷 大祐, 吉田 光男
    セッションID: 4Xin2-18
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究では、日本国内における様々なエリアの特徴を評価する手法として、ソーシャルメディアから取得した感情情 報を利用した評価方法について取り扱う。先行研究では、Twitter のデータセットから抽出した感情情報と住宅価格の関 連に着目し、幸福感の高いエリアと物件価格に相関関係が見られるなど、感情情報が経済的価値の評価に使用可能な情 報であることが報告されている。そこで本研究では、Tweet の位置情報と感情情報の組み合わせを元にして、ポジティ ブ及びネガティブなそれぞれの感情の出現率の違いと、平日または休日のカレンダー上の区別を利用して、感情の起伏 が大きいエリアを抽出することを行い、それらの場所に対する考察を行った。2022 年に生成された約4000 万のTweet に対してML-Ask を用いた感情情報の抽出を行った結果、都市部や観光地などでポジティブ、ネガティブの両面で感情 の起伏の大きいエリアが検出された。感情情報に対して一定の処理を加えることで、特定の地域の特徴をソーシャルメ ディアの情報から推定するフレームワークに拡張できる可能性が示唆された。

  • 董 熙瑩, 髙野 剛志, 計良 宥志, 川本 一彦
    セッションID: 4Xin2-19
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    ロボット制御におけるDecision Transformerのロバスト性を検証する.Decision Transformerは,Transformerを用いたオフライン強化学習モデルで,従来の強化学習と同等以上の性能を出すことが報告されている.本研究では,オフライン強化学習用の収集データに含まれていない故障現象に対して,3つのロボット(Half Cheetah,Hopper,Walker2D)を用いてDecision Transformerのロバスト性を評価する.ロバスト性評価では,3つのデータセット(Medium-Expert,Medium,Medium-Replay)に対して,アクチュエータが動作しない状況を模擬する.実験結果は,3つのデータセットのいずれの場合でも,すべてのロボットの報酬が低下する傾向が確認された.この結果は,Decision Transformerのロバスト化が必要であることを示している.

  • 岩崎 翔, 粟井 修司, 青木 俊彦, 石塚 昌平, 紺野 剛史
    セッションID: 4Xin2-20
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本論文では,「ナラティブ(narrative)」(物語、語り)に合致した画像の自動生成手法を提案する. 近年,ナラティブが注目されている.ナラティブによる情報伝達は,複雑な情報を理解しやすく,感情に訴えかけやすいという特徴がある.一方で,人の情報処理は視覚優位であることが知られており,ナラティブと画像の併用は情報伝達において効果的であることが期待される.そこで,本稿では,画像生成AI(Text-to-image)を用いて,ナラティブの文章を入力として文章に合致した画像を生成することを目指す. ナラティブでは,文章内に書き手のメッセージが明示的に記載されない場合も多く,文章から画像生成プロンプトを直接生成する手法ではナラティブの主題を正しく表現できない.そこで,提案手法では,ナラティブを表現するための画像の特徴を段階的に具体化していくことで画像生成プロンプトを生成する.また,複数枚の生成画像をVision Language Modelにより評価することで,より合致度の高い画像を選別し出力する.生成画像に対する主観評価を行い,提案手法がナラティブにより合致した画像を生成できることが示唆された.

  • 中江 俊博, 林 勝悟
    セッションID: 4Xin2-21
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    顧客生涯価値 (LTV ; LifeTime Value) の予測はマーケティング施策の決定などに重要だが,顧客が利用するサービスにおいて売上が発生するケースが少ない場合,売上金額の分布がゼロに偏る点が問題となる.Zero-Inflated Log-Normal (ZILN) モデルは売上発生確率と売上金額分布を同時に考慮することで,ゼロに偏る売上データを学習してLTVを予測するモデルである.ただこのモデルでは,顧客が対象サービスを利用を開始してからの経過時間を考慮しないため,ある一定期間を経過した時点での売上を学習データとして用いる必要があり,十分な学習データが集められないだけではなく、予測時にこの経過時間を変更することができない.本発表では,この問題点を解消するためにZILNを拡張した経過時間考慮ZILNモデル(td-ZILN)を提案する.このモデルではZILNモデルにおける売上発生確率について顧客属性と経過時間の両方を考慮する.この修正により,学習データに任意時点の売上データを含めることができ,予測時に経過時間を変更できるようになるため,学習時と予測時の利便性が向上することを示す.

  • 山野 陽祐, 田森 秀明, 杉野 かおり, 黒田 由加
    セッションID: 4Xin2-22
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    End-to-Endの音声認識モデルは、高品質な学習データを使用することで、高い性能を発揮することが知られている。一方、高品質な学習データを作成するには一般的には人的コストや管理コストが大きくなる。 本研究は、音声認識モデルのための高品質な学習データを効率的にアノテーションするため、アクティブラーニングの手法を用いたデータ選択手法を提案する。音声波形から算出した特徴量を用いて構築した、文字誤り率(CER)予測モデルにより、データプールから優先的にアノテーションするデータを選択することを実現した。また、提案手法により構築した音声認識モデルは、ランダムにアノテーションした学習データと比較して優れたパフォーマンスを示し、提案手法が効率的な学習データの作成に寄与することを実証した。一方、ラベルの品質面から見た効率的なラベル付けは、アノテーターの心理的側面に影響し、コストや音声認識モデルの精度に良い影響を及ぼすことをあきらかにした。

  • 杉村 真理子, 小林 一郎
    セッションID: 4Xin2-23
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    反実仮想機械学習(CFML)とは、観測され得たが実際には観測されなかったデータを捉えるための機械学習技術である。オフポリシー評価(OPE)はCFMLの研究領域の一つであり、別のポリシーの運用データを用いて仮想的なポリシーを評価することを目的としている。これにより、リスクやコストを伴うオンライン実験を行うことなく、新たなポリシーの性能を評価することが可能となる。これまで様々なOPE手法が提案されてきたが、適用するドメインの環境設定によって各OPE手法がポリシーを評価する精度は異なるため、1つの実験環境だけで手法の性能を測ることはできない。したがって、複数の実験環境を用いてOPE手法を評価する必要がある。本研究では、3つの基本的なOPE手法について異なる実験環境で性能評価実験を行い、環境要因がOPE手法の精度にどのように影響を与えるのかについて考察を行った。

  • 池ヶ谷 健太, 田口 亮
    セッションID: 4Xin2-24
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年登場したCLIPは,視覚と言語の相互理解を革新的に進めたモデルとして,様々なタスクで利用されている.しかし,CLIPのエンコーダが視覚的な物体間の空間関係を十分に正しく出力できないことが先行研究により指摘されている.この指摘から,CLIPの単純な利用では言語的な相対位置理解が不十分であると考えられる.そこで本研究は,CLIPを参照表現理解という空間理解を必要とするタスクに適用させたモデルであるReCLIPを参考に,相対位置理解が可能なモデルを提案する.ReCLIPが2次元的に空間関係を処理するのに対し,提案モデルは3次元的に空間関係を処理することで相対位置理解を目指す.また本研究では,向きを踏まえた相対位置について,人座標系に限定した実装となっている.RefGTAデータセットを用いた評価実験を通し,提案モデルは「前」という空間関係に対してReCLIPから1~2%の改善を示した.また,その中に含まれる人の向きを踏まえた相対位置の推論が必要なデータに対して12~13%の改善を示した.

  • 陳 彦豪, 竹内 勇剛
    セッションID: 4Xin2-25
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    日常生活の中で生じる「ゴミ」は,資源の再利用や環境保護などの観点からそれらの適切な分別が強い社会的要請になっている.だがゴミの分別は煩雑で面倒な作業であり,これが個人の努力に委ねられている以上はその徹底には限界がある.これまでゴミ分別を促進するための活動は、概してそれを実行することに対して報酬を与えるといった外発的動機付けに依存していた。だが本研究は、必ずしも能動的・積極的な認知的姿勢で臨まれない日常生活の中で生じるゴミの分別作業を、個人が属する地域のコミュニティの住民同士をチームメートとした協同性を与え、他の地域コミュニティからなる別チームとの競い合いを通した競争性によって個人の自尊感情を涵養し、内発的動機に基づく能動的・積極的なゴミ分別の量と質の向上と持続を狙っている。そのために本研究では,ある個人が属する住民コミュニティの成員間の協同性と,他の地域における同様な住民コミュニティとの間での競争性を引き出すためのゲーミフィケーション的インタラクションを誘発するスマートフォンアプリを開発する.

  • 松野 省吾
    セッションID: 4Xin2-26
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    視線入力インタフェースは一般に随意的な視線の移動や注視を入力信号として捉え,コンピュータなどの操作を行う装置である.本研究では,従来の随意的な操作に加えて,非随意な生理反応を併用して多様な表現を可能とする視線入力インタフェースの開発を目的とし,視線移動や瞬目を計測する手法を検討している.本稿では,特殊な随意性の視線移動と並行して計測した瞬目の随意性と非随意性を自動的に識別し,異なるフィードバックを行うための識別手法を提案する.さらに,実験により提案手法の評価を行ったところ,約85%の精度で随意的な視線運動を識別できた.

  • 守屋 響, 大和 淳司
    セッションID: 4Xin2-27
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    画像キャプション生成は,画像の内容を説明する文章を自動的に生成する技術である.キャプションの生成により,画像の詳細な理解につながると期待される.しかし,一般的に生成されるキャプションには画像内のオブジェクトの位置関係が含まれていない.本研究では,画像に登場する二つのオブジェクト(人物,動物,乗り物など)について左右の位置関係を含むキャプションの生成を行う.画像キャプション生成タスクに使用される学習データセットには,基本的に位置関係が含まれていない.そこで,既存の学習データセットに位置関係を追加したキャプションを作成し,それを使用して学習を行った.学習にはVision and LanguageモデルであるGITを使用した.二つのオブジェクトが写る画像を使用し,キャプション生成テストをした.結果,生成されたキャプションにはオブジェクトの左右の位置関係が含まれていることが確認できた.今回作成したデータセットを使用することにより,キャプションに含まれる情報量を増やすことができ,これが画像のより詳細な理解につながると考える.

  • 岡田 英都, 大槻 恭士
    セッションID: 4Xin2-28
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    人狼ゲームでは,相手の嘘を見破る・相手をだます・相手を信頼する・相手を説得するなどの行為が重要であるが,現在の人狼知能エージェントには未だ相手を説得する機能は実装されていない.今後人狼知能が説得能力を備えるためには,他者の思考モデルを推測し,それに合わせて他者を説得する機能が必要となる.近年の人狼知能国際大会では,参加エージェントが機械学習によって試合中の行動を決定する傾向にあるが,この場合,他者はおろか行動主体ですら行動の理由すなわち思考過程を説明することができないため,説得機能の実装は困難である.そこで本研究では,すべての生存エージェントが行う追放投票に着目し,ゲーム結果への影響が大きい役職である人狼と占い師の投票アルゴリズムを決定木で説明することを試みる.まず,第5回人狼知能国際大会決勝のシミュレーションを行い,推定対象エージェントから見た他者に関する説明変数をゲームログから抽出した.次に,推定対象の役職が人狼あるいは占い師のときの投票先決定ルールを決定木により推定し,機械学習エージェントのように戦術が陽にプログラミングされていない場合でも戦術を説明できることを示した.

  • 竹田 悠哉, 吉田 塁
    セッションID: 4Xin2-29
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデル(LLM)の数学的推論能力は,自然言語のみでは高い性能を発揮しないが,コード生成や外部ツールを統合することで大幅に向上する.自然言語のみで数学的推論能力を強化すれば,全体的なパフォーマンスが向上することが期待されるが,そのための方法はまだ確立されていない.LLMは主に英語を対象としているが,他の言語でも活用することでタスクのパフォーマンスが向上する例が確認されており,数学的推論能力に関しても改善の可能性が示唆されるが,まだ明らかになっていない.本研究は,言語がLLMの数学的推論能力に与える影響を明らかにすることを目的して,代表的なLLMであるGPTを利用し,5つの異なる言語で数学的課題における精度を比較した.英語以外の言語で実施されたいくつかの課題は,英語よりも精度が高いことが明らかになった.本研究は,LLM の数学的推論能力と多言語能力に関する新しい知見を提供できることが期待される.

  • 髙野 志歩, 佐藤 美唯, 伊東 和香, 秋信 有花, 川口 貴子, 倉林 利行, 丹野 治門, 倉光 君郎
    セッションID: 4Xin2-30
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    ソフトウェア開発において,コード文書はソフトウェアの理解と維持に必要不可欠である.人手によるコード文書の作成と維持にはコストがかかるため,LLMを用いたコード文書の自動生成が期待されている.しかし,従来の字句ベース評価では意味的な解釈を考慮できず,参照テキストの準備にも高いコストがかかるという課題がある. この課題を解決するため,本研究では逆翻訳による実行ベース評価法を提案する.提案手法では生成されたコード文書からコードを逆翻訳し,その実行結果をベースにコード文書の評価を行う.このプロセスにより,意味的な解釈や同義語,表現の多様性を含む評価が可能となる. 本稿では,提案手法を実装した自動評価ツールlm-chaineval-harnessの紹介と,提案手法の検証実験について報告する.我々の開発するlm-chaineval-harnessでは,ユーザーが手軽に評価を行える環境を提供する.実験から,提案手法は従来の字句ベース評価と比較して,意味的な解釈を含めた評価が可能であり,同義語や表現の多様性を考慮できることが定性的に示された.

  • 藤原 大悟, 泉谷 知範, 清水 昌平
    セッションID: 4Xin2-31
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    因果推論の多くの応用では、最終的に、操作可能な変数への介入によって特定の指標を最適化することを目指す。この最適化は、仮想的な介入に対する指標への介入効果の推定を通じて行われるが、多くの従来手法はこのような介入操作は一度しか行われないと仮定している。しかし、実際に介入操作を実システムに適用すると、モデルの推定誤差、外生変数のランダム性、様々な外乱などにより、指標の最適値対して誤差が残ることが多い。そのため、実際に望ましい最適値を得るためには、複数回の介入によって誤差を収束させる必要がある。本研究では、介入を繰り返すことで誤差を吸収し、指標を望ましい値に収束させる因果介入ベースの最適化フレームワークを提案する。本手法は、「因果モデルに基づく介入効果推定とその効果から逆算した介入計画」と「介入の実現とその結果データに基づく因果モデルの改善」を交互に繰り返すことで、誤差を最適値に収束させる。これは力学系の制御への応用も期待される。本手法の性質を評価するため、トイデータを用いた予備実験を行った。

  • GPT-4はメタ認知を持つか?
    吉澤 駿, 恩蔵 絢子, 野澤 真一, 髙野 委未, 茂木 健一郎
    セッションID: 4Xin2-32
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデル(LLM)の1つであるChat Generative Pre-Trained Transformer (ChatGPT)は、その認知能力について分析・評価されている。例えば、ChatGPTは誤信念課題においてロバストな性能を示し、心の理論を持っていることが示唆された。しかし、GPT-4がメタ認知能力を有しているかどうか、つまり、GPT-4が自分自身のパフォーマンスをどれだけ正確に認識できるかを評価し、明らかにすることは重要であろう。ここでは、LLMの一般的なメタ認知能力について、ChatGPTと人間の確信度判断を分析することで調べた。人間は正解したときよりも不正解したときの方が確信度が低い傾向があった。しかし、GPT-4は正解できなかった問題でも高い確信度を示した。これらの結果は、GPT-4が特定のメタ認知能力を欠いていることを示唆している。

  • 山本 晋太郎, 安藤 純平, 渡邉 航, 小野 利幸
    セッションID: 4Xin2-33
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    製造や社会インフラなど様々な領域において収集されるテーブルデータ(表形式データ)を分析・利活用する技術への期待がある.実問題におけるテーブルデータは,データの収集拠点間の差異やデータ項目の追加などの要因により列構成が異なるデータが混在する場合がある.一般的なテーブルデータ解析手法は,入力するテーブルデータの列構成が同一であることを前提としているため,列構成の種別ごとにモデルを学習する,または,全データに共通する列のみを抽出する必要があった.これに対し,列構成が異なるデータを1つのモデルで学習できる深層学習方式としてTransTabが提案されたが,列名とカテゴリ情報である値をベクトルの集合として処理する際にその対応関係が失われ,異なる列に同一の値が出現するデータを区別することが困難になる問題があった.提案方式では,列名と値をそれぞれエンコーディングした特徴量を結合したベクトルを入力することで,異なる列に出現する同一カテゴリ値の区別を可能にした.実験により,テーブルデータの分類タスクにおいて,提案手法は従来手法と比較して16.1ポイント以上の性能向上を確認した.

  • 竹下 隼司, 松崎 拓也
    セッションID: 4Xin2-34
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    朗読音声では,作品や朗読者,また地の文か会話文か等の差異によりポーズ長分布に異なりがある.そこで本研究では,朗読対象のテキストに基づきポーズ位置およびポーズ長を予測するための学習の際に,訓練データにおけるポーズ長を標準化することで分布の差異を吸収することを試みた.その結果,朗読作品ごとの標準化,地の文・会話文に分けた上での標準化など, いくつかの正規化の方法のうち,朗読作品ごとの標準化が最も有効であることがわかった.

  • 岡田 真依, 坪倉 和哉, 入部 百合絵, 北岡 教英
    セッションID: 4Xin2-35
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    現在の対話システムでは,同じ内容の質問を繰り返す,事実と異なる発言をする,などの対話破綻が生じている.システムの対話破綻はユーザの対話意欲の低下を引き起こす要因となるため,破綻からの適切な対話修復が必要である.先行研究において,人同士の対話は親密度や社会的役割によって対話行為に違いがあると報告されているため,本研究では従来手法では考慮されていなかった対話システムとの関係性に着目し,対話破綻修復手法を提案する.対話破綻に対するユーザ発話,それに対するシステムの修復文を収集し,対話行為に基づき関係性毎の違いを明らかにする.そこで,まずクラウドワーカーに破綻例を提示し,破綻に対するユーザ発話と修復文を収集した.収集した発話に対話行為タグを付与し,その傾向に基づいて破綻修復手法を検討した.関係性毎に破綻後の遷移図を作成しシステムが対話破綻した際に,ユーザの対話行為に応じて修復文を生成する.実装したシステムの修復発話をアンケートにより評価した結果, 6項目中3項目で提案手法が最も良い評価を得た.このことから破綻修復には関係性や破綻後のユーザ対話行為を考慮する必要性が明らかとなった.

  • 太田 幹, 秋元 裕介, 奥井 恒
    セッションID: 4Xin2-36
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    学術論文の質と影響力を評価するための指標は、研究者の業績を正当に評価するうえで重要な役割を果たしている。また近年では日々新たな論文が発表されるようになり、すべての論文を考慮することは非常に困難であるため、論文の評価指標は重要な論文を選択するための定量的な判断基準としての役割を担うようになっている。学術論文の評価指標としては主に引用数に基づいた様々な指標が提案されている一方で、引用数が学術論文の質を正しく反映しているかどうかという点については議論の余地がある。本研究では既存の学術論文の評価指標を幅広く調査し、それらの指標が学術論文の質や影響力を適切に反映しているかどうかという点について、特定の領域をサーベイする場合や特定のトピックについて詳細な調査を行う場合など実務上の観点から分析を実施した。また、引用数だけでは学術論文を適切に評価できないケースにおいて、定量的な評価を補完するための新たな評価指標の可能性を検討し、学術論文の内容を考慮した新しい評価指標を提案した。

  • 長尾 浩良, 五藤 巧, 是枝 祐太
    セッションID: 4Xin2-37
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年,言語モデルの大規模化が加速し,これまでは個別の開発が必要であった広範な言語処理タスクを単一モデルで扱えるようになった. GPTなどの単方向事前学習済み言語モデルはパラメータ数数十億から数百億規模の超大規模化が進んでいるが,BERTなどの双方向事前学習済み言語モデルではパラメータ数は高々数億程度にとどまる. しかし,古典的なタスクにおいては,比較的小さなパラメータ数の双方向事前学習済み言語モデルの方が有用であることが示唆されている. 本研究の目的は,モデルアーキテクチャと事前学習方法のいずれによってその差異がもたらされるかを明らかにすることである. 本研究では,統制された条件下で双方向・単方向の事前学習済み言語モデルを学習し,事前学習前に比べ事前学習後の下流タスクの性能 (GLUEスコア) の差が広がることを確認した. 事前学習前における両モデルの差異はアーキテクチャのみであるため,事前学習方法による影響はアーキテクチャの影響よりも支配的であることが示唆された.

  • 川上 祐樹, 吉田 光男
    セッションID: 4Xin2-38
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究では,日本企業の有価証券報告書に記載された主要な取引先の情報を利用し,企業間のネットワークの時系列での変化を調査する.これまでの研究では,米国において業種間の取引関係を,ネットワーク指標を用いて中心産業と非中心産業に分けて,業種間での株価や業績の影響の有無について調査している.一方で,時系列での業種間の取引関係の変化に関して,十分調査されていない.そこで本研究では,2013年から2023年に有価証券報告書に記載された取引について,売上高に占める取引高の割合で取引ネットワークを作成し,固有ベクトル中心性の業種別変化を調査した.卸売業が最も中心性が高いものの,2019年以降は国外企業が最も中心性が高くなった.また,中心性の高い業種は入れ替わりが少ないなど,業種別での中心産業がある程度固定されている可能性が示唆された.

  • 佐藤 美唯, 野口 結衣, 伊東 和香, 梶浦 照乃, 髙野 志歩, 倉光 君郎
    セッションID: 4Xin2-39
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    生成AIはソフトウェア開発とプログラミング教育に大きな変化をもたらしている.このような変化は,従来のプログラミングスキルの有用性や新たなスキルを習得する必要性についての疑問が浮上している.生成AIを活用したプログラミングおいて重要となるスキルを理解することは,将来のソフトウェア開発とプログラミング教育の方向性を考える上で重要になる.本研究では,開発者が持っているスキルの習熟度の違いが生成AIよって生成されたコードの品質にどのように影響を与えるかを調査する.我々は,開発者に求められるスキルを,コーディング力,プロセス力,ドメイン知識,プロンプト力の4つのスキル系統に分類し,コードの品質との関係性を分析するために予備調査を行った.その結果,プロンプト力が最もコードの品質に影響を与える可能性があることが示唆された.本発表では,予備調査の結果を報告し,より精密な調査研究のための展望を議論したい.

  • 秋元 裕介, 奥井 宜広, 窪田 歩, 吉田 琢也
    セッションID: 4Xin2-40
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年,様々なIoTデバイスがネットワークに接続されるようになり,IoTデバイスに対するサイバー攻撃への対策が重要な課題となっている.マルウェアに感染したIoTデバイスを検知する手法として,近年ではグラフニューラルネットワーク (GNN) を用いた手法が提案されている.統計的な情報のみを用いた従来手法に比べて,GNNベースの手法では通信経路や通信の順序・機能的なまとまりなど通信の様々な関係性を考慮することができる.一方で,先行研究の多くは特定の期間における静的なグラフを対象としており,時間の変化による通信の変化を考慮できていない.現実の通信データの多くは時間とともに変化し,実務においては動的に変化する通信を扱うことができる手法が求められる.そこで,本研究では通信の順序や機能的なまとまりを表現する動的なグラフを対象とした新しい異常通信検知手法を提案する.動的グラフの中でもContinuous Graphと呼ばれるグラフを用いることにより,計算量を抑えつつ大規模な通信データを扱えるようになった.公開データセットを用いて本手法の精度評価実験を実施し,先行手法よりも精度を向上させることができた.

  • 進藤 稜真, 塚村 祐希, 柳田 栞吾
    セッションID: 4Xin2-41
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    錯視は実世界の認識に深く関わる重要な現象であり,その生起メカニズムの理解は人間の視覚情報処理の研究に寄与してきた.また,近年では大脳皮質における予測符号化の処理を模倣したモデルの一つであるPredNetを,人間の主観的視点から日常的な世界を撮影した動画を用いて訓練したところ,直接学習させていないにもかかわらず,人間の経験する運動錯視と同様の予測がモデルからも生成されたことが確認されている.そこで本研究では,PredNetを観測者の動きが異なるデータセットで訓練し,錯視と同様の予測が生成されるかどうかを観察することで,錯視的な動きを予測する背景に存在する学習の特徴分析を試みた.その結果,各データセットで学習したPredNetはそれぞれ大きく異なる予測を行うことが確認された.このことから,錯視の生起要因として,観測者の動きが重要な要因であることが示唆された.

  • 尾野 愛莉, 小松 史弥, 高橋 春輝, 小沢 勲男, 竹川 高志
    セッションID: 4Xin2-42
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    意思決定において無意識のうちに判断を歪められてしまう認知バイアスとしてアンカリング効果がある.アンカリング効果とは先に提示される数字をアンカとし,アンカに近い回答をする現象で,アンカの値によって回答がばらつき異なること,予想と離れると効果が弱まることが知られている.また,アンカが与えられた直後の回答はアンカの近くにあるが,尤もらしい範囲に入るまで時間をかけて調整し,事後回答を算出するAnchoring-and-Adjustmentの考え方がある.先行研究においてBayesian Brain仮説をもとにベイズ更新でメカニズムを定性的に再現できたが,事後回答の具体的な計算過程に検討の余地がある.本研究では,脳がアンカと予想を反復して回答していると仮定して,時間の影響/反復回数と対応できる変分ベイズを用いた.反復回数がアンカの効果にどう影響するか検証した.また,反復回数の異なる事後回答がどのような動作で回答しているのか検証した.その結果,反復回数によって事後回答に差異が見られ,反復回数がどのような方法で回答しているのか見つけることができた.

  • 伊東 和香, 佐藤 美唯, 髙野 志歩, 倉光 君郎
    セッションID: 4Xin2-43
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    コードLLMの開発において、instruction tuningがコードLLMの強化に効果的であることがわかっている。instruction tuningは指示を追加学習することで汎化性能を向上させる手法であるが、どのような指示形式が最適であるかについて様々な見解がなされており、明らかになっていない。本研究の目的は、コードLLMのinstruction tuningの効果を高めるため、指示形式の違いがコード生成性能に与える影響の調査を行うことである。指示形式として、コードの抽出に用いられる出力形式に特に着目し、実験を行った。また、実験結果の可視化を行った。結果より、出力形式の違いによるモデルのコード生成の性能差を明らかにし、Markdown形式が最も汎用性に優れていることを明らかにした。また、出力形式の指定なしよりも、出力形式の指定ありの正答率が高いことを明らかにした。

  • 櫻井 慶悟, 藤後 廉, 小川 貴弘, 長谷山 美紀
    セッションID: 4Xin2-44
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    推薦システムの分野において,アイテムの推薦理由を提供することを目的とした説明可能な推薦は重要な研究課題である.説明可能な推薦を実現するためのアプローチとして,ユーザのインタラクション情報等に基づき構築された知識グラフ上を推論することにより,知識グラフ上のパスを推薦理由として提示する手法が提案されている.しかしながら,これらの手法は,知識グラフ埋め込み手法により得られた特徴量のみに基づいて推論を行っているため,潜在因子モデルや深層学習モデルに基づく手法と比較し,推薦精度が低くなることが報告されている.近年,グラフから有用な特徴量を獲得するための手法としてmasked modelingを活用したGraph Masked Autoencoderが提案されており,ユーザのインタラクション情報を含む異種グラフに適用することにでより高度なユーザの嗜好の把握可能になると期待される.そこで本論文では,Graph Masked Autoencoderより得られる特徴量を用いた知識グラフ推論に基づく説明可能推薦手法を提案する.実社会データセットを用いた実験により,提案手法の有効性が確認された.

  • 渡邉 琉一
    セッションID: 4Xin2-45
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本稿では、事前学習済み日本語BERTモデルのFeed-Forward-network層において、概念に関する知識を保持するニューロンを特定する実験に取り組む。具体的には、事前学習を行った日本語 BERTモデルに単語穴埋めタスクを解かせる際にモデル内の重要な重みパラメータ(ニューロン)を特定し、その場所や重要性を比較対照実験により確認する。また、事前学習済み英語 BERT による先行研究の結果との比較も行い、特定の条件下で実験結果が異なることを示す。

  • 古賀 友里愛, 神藤 駿介, 宮尾 祐介
    セッションID: 4Xin2-46
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本論文の目的は,対話において発話に反映されない可能性のある聞き手の感情を,話し手の発話から予測することである.聞き手に生じる感情を知ることは,対話システム等の分野において非常に重要である.先行研究は,「聞き手に生じる感情は次の聞き手の発話に表現される」という前提に基づき,話し手の発話から次の聞き手の発話にアノテーションされた話し手の感情ラベルを推定する手法をとっている.しかし,聞き手の感情は次の聞き手の発話に必ずしも表現されるとは限らない.そこで我々は,先行研究の前提を取り除き,話し手の発話によって聞き手に生じる感情を直接推定するタスクを提案し,そのベースモデルを構築する.さらに,このタスクの難易度を関連タスクと比較し分析する.実験の結果,我々のモデルは聞き手に生じる感情をある程度予測できることが示された.また,更なる分析により,特に聞き手の感情予測には対話履歴が重要な役割を果たすこと,聞き手の感情は話し手の感情に比べ,本人の発話なしでもある程度予測可能であること,隠れた感情は発話に表現された感情と比較して予測が難しいことが示唆された.

  • 金子 瑠晟, 武政 誠
    セッションID: 4Xin2-47
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    食感はおいしさの約6割を支配している。食感の(1)分析および(2)設計と製造にディープラーニング応用例を紹介する。(1)機器分析による食感分析法は、TPA法が主流である。TPAとは、食品圧縮試験結果から特徴値を抽出し、多変量解析によって食感を分析する手法である。TPAは、官能試験と比較すると、類似した食感の判別や分析が困難である。ディープラーニングを食感分析に適用する事により、機器分析として実施する圧縮試験でも類似した食感の判別や分析が可能となった。(2)現状の食感設計は、経験則に基づいてのみ実施されているため、数値予測や設計が困難である。このように、望む食感を的確に設計するための指針が無い事が、食品開発を行う上での大きな課題となっている。ディープラーニングを食感設計へと応用すべく、3Dプリント食品の構造と食感の対応を学習させることで、食品構造に基づいた食感の設計指針作成を試みた。3Dプリント食品は、多種多様な食品構造を取る事が可能であり、幅広い食感を生み出すポテンシャルを持つ。構造に基づいた食感の設計指針が作成されることで、望む食感を与える食品の開発が可能になる事が期待される。

  • 福本 拓也, 田中 剛
    セッションID: 4Xin2-48
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本稿ではテキストの品質評価における,論理展開の自然さを示すcoherenceについてのタスクを定義しルーブリックを作成した.また,作成したルーブリックを用いて英語学習者のエッセイに対し専門家の人手評価を行ったデータセットを作成した.この際,文法や語彙の間違いのようなcohesionに関わるミスを考慮させないよう指示し,coherenceに特化した評価を実施した.3人の専門家による人手評価のFleiss' Kappaは0.17だった.また,特化モデルやLLMを用いたcoherence自動評価も行った.自動評価においては,GPT-4によって直接評価する手法が最も人手のcoherence評価と近く,Pearsonの積率相関係数で0.381となった.また,Sentence Orderingを用いた独自の手法は,特定のスコア指標を用いることで,従来のMultiNLIモデルを超える性能となった.

  • 山内 洋輝, 田村 光太郎
    セッションID: 4Xin2-49
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    ニュース記事に含まれる組織名抽出モデルでは、一般的で自然なテキストに対するデータにおいては一定程度の成果をあげている。しかし、ニュース記事の中でも金融や証券領域の記事では、数値で書かれた企業コードや表構造に整理されている内容が含まれていることが多い。これまでの固有表現抽出では、構造化データや企業を表すコード(数値情報)が混在したテキストを扱うことは少なく、抽出は難しかった。本研究では、機械的に構成したこれらの構造化データを含むテキストデータを学習させ、既存の組織名抽出の精度を落とさずに、構造化データでの抽出性能を持たせることに成功した。

  • 坂井 智哉, 勝木 孝行, QIU Haoxiang, 恐神 貴行, 井上 忠宣
    セッションID: 4Xin2-50
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    意味領域分割(セマンティックセグメンテーション)において、少量データで新規クラスの認識を目指す問題を考える。推論時に既知クラスと新規クラスの両方が登場する設定では、新規クラスを上手く学習することに加えて、学習済みの既知クラスの認識性能が落ちる破滅的忘却を防ぐことが課題となる。本研究では、既知クラスの認識性能をほとんど保持したまま新規クラスを認識できるモデルが作れることを理論解析と実験を通して示す。

  • 平尾 総太郎, 阿部 香澄, 中村 友昭, 長井 隆行
    セッションID: 4Xin2-51
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデル(LLM)を活用した研究やサービス開発が盛んになされているが、子育て相談に特化したチャットボットは数少なく、育児支援の分野において重要な意義を持っている。我々のプロジェクトでは、親の子育てに関する相談に答えるLLM(本研究ではGPT-3.5)を用いた育児相談チャットボットの開発を進めている。しかし、現状ユーザの質問に対して十分的確な回答を行えているとはいえない。本研究ではまずユーザの質問に的確な回答をするための要因を分析し、現状の問題点として、ユーザの質問意図の不明瞭な解釈、回答の冗長さと適切性の欠如などがあることを明らかにした。さらに、これらの問題へ対処するため、ユーザの質問の意図を分類し、それぞれユーザに適した返答を生成するシステムを提案し、評価した。提案したシステムは、ユーザの意図をより的確に判別したことで、焦点を絞った簡潔な回答を生成でき、育児相談分野でのLLMを活用したチャットボットの可能性を示すことができた。しかし愚痴の取り扱いなどの課題は依然として残り、育児支援チャットボットのさらなる改善が必要である。

  • 橋本 敦史, 前田 航希, 平澤 寅庄, 原島 純, RYBICKI Leszek, 深澤 祐援, 牛久 祥孝
    セッションID: 4Xin2-52
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    手続き的な作業を計算機により理解することで、人の作業体験を向上させることができると考えられている。本研究では特に調理を対象として、このような作業理解に向けた新しいデータセット、および、ベンチマーク課題を提案する。近年の深層学習に支えられた映像理解技術はWebで収集される大量のデータに基づいたものとなる。しかし、Webで公開される映像は人の手による編集を得たものであり、作業観測映像のような未編集なものとの間にはドメインギャップが存在する。近年では比較的大規模な一人称視点映像データセットも公開されているが、一人称カメラにもバッテリーやプライバシー、あるいはUIの複雑さの問題があり、一般社会での応用には課題を残している。一方で、近年のスマートフォンカメラの画角の広角化に伴い、固定視点であれば誰でも簡便にキッチンを視野角に収めた映像が取得できるようになった。そこで本研究ではスマホカメラを一般家庭へ配布することで多数の環境で撮影された調理映像のデータセットを構築する。また、オフラインとオンラインの2つのベンチマーク課題として、動画キャプショニングとオンラインレシピ検索を提案する。

  • 久保 祐喜, 山下 智也, 山田 真徳
    セッションID: 4Xin2-53
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    対話システムの構築に関する手法は多くある一方で,対話の評価に関する研究は課題が残される.対話の質のような数値化が困難な指標は人手で評価することが主流である.近年は対話データの評価にLLMを用いる手法が提案されている.LLMによる対話の評価は人間に比較的似た推定を行う一方で,十分な相関であるとは言えない.Elo ratingは,2つのデータの比較によってデータの評価を行っているため,評価者によって基準が異なることを考慮する必要がなく,精度が上がることが期待される.しかし,Elo ratingはすべてのケースで有効であるかは確認されていない.特に,正解データでの評価値の分布が偏っている場合などは精度が低下すると考えられる.本研究では,Elo ratingが評価値の分布に依存せずに高い精度で推定できるかを検証する.

  • 大海 悠太, 五十嵐 健太, 遠山 紗矢香, 山田 雅之
    セッションID: 4Xin2-54
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    身体スキルの獲得場面では、学習者の動作や発話を可視化・共有し、複数名で協調的に振り返ることが支援として有効なことが明らかになりつつある。本研究では身体スキル協調学習支援のために、動作を可視化するシステムを開発し、実験を行なった。 このシステムでは、人間が動作している映像をアップロードすると、OpenPoseにより時系列の姿勢推定結果を出力し、Chart.jsによりユーザが見たい身体の箇所をインタラクティブに選択してグラフを閲覧できるようにしている。 今回はアイスホッケーのシュート練習を対象にしてシステムの実験を行なった。実験参加者は大学生6名でアイスホッケー部員である。前半3回はシステムなしで練習をしてもらい、後半3回はシステムありで練習を行なった。また、各セッション時にアンケートを実施した。結果から、参加者は気になる身体部位の振舞いをグラフ化して閲覧し、練習に活かしていた。また、他の参加者の動作と自分の動作を比較している報告があり、協調学習を行っている様子が伺えた。

  • 増田 樹, 中川 慧, 星野 崇宏
    セッションID: 4Xin2-55
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    ポートフォリオ構築は実務的にも学術的にも重要な問題であり、平均分散法等の様々な手法が構築されてきた。 特に、Black Litterman~(BL)法は、期待リターンと投資家の見通しを確率変数として扱い、ベイズ更新を通じて資産ウェイトを推定することで、投資家の見通しを統合したポートフォリオを構築できる。 しかし、BL法は資産ウェイトに影響を与えるパラメータが多く存在するため、過度なリバランスが発生する可能性がある。 過度なリバランスは取引コストの増加につながり、パフォーマンスが悪化するため軽減する必要がある。 そこで、本研究では取引コスト削減のために、Sparse Black Litterman法をする。具体的には、ウェイト変化に対してSpike and Slab事前分布を導入することで、ウェイト変化にスパース性をもたらし、不必要なリバランスを抑制する。これにより、取引コストを削減しつつ、投資家の見通しを統合した効率的なポートフォリオを構築できる。理論的にも事前分布がリバランスを削減できることが示せる。 実証分析では、人工データおよび実データを用いて、提案手法の有効性と取引コスト削減の効果を検証する。

  • 生成AIを活用した特殊詐欺訓練ツールの訓練効果に関する評価
    井手 健太, 池田 妃那, 近野 恵, 吉野 航平, 紺野 剛史, 桐生 正幸
    セッションID: 4Xin2-56
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    特殊詐欺は巧妙かつ新たな手口が次々に導入されるため,高齢者の被害は増加し続けている.未然防止のため,警察などが詐欺電話の模擬体験会を実施しているが,模擬体験の多くが録音した過去の犯行音声を一方的に聞く形式であり臨場感が低く,訓練効果は低い.本稿では,生成 AI と犯罪心理学の知見を活用して,犯人との会話をロールプレイ可能な詐欺疑似体験機能と体験中の心身状態を基にリスクを提示するフィードバック機能を備えた特殊詐欺訓練ツールを提案し,訓練効果を評価する.特殊詐欺訓練ツールの訓練効果を検証するために,28名の高齢者に対して特殊詐欺訓練ツールを体験させる実験を実施した.機能ごとの訓練効果を評価するために,参加した高齢者の半数には詐欺疑似体験機能のみを体験させ,残りの半数には詐欺疑似体験機能に加えてフィードバック機能を体験させた.訓練効果として体験後のアンケートデータから防犯意識を評価した。ツールを体験した高齢者全体の防犯意識の向上を確認することができた.また,詐欺疑似体験機能のみを体験した場合に比べて,フィードバック機能も合わせて体験した場合の方が,訓練効果がより高いことが示唆された.

  • 阿部 有紗, ジェプカ ラファウ, 荒木 健治
    セッションID: 4Xin2-57
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究は大規模言語モデルの性能調査に向けて,日本語のストーリーデータセットを活用した大規模言語モデルの性能評価を行う.そのために我々が開発したDanStoデータセットを用いる.DanStoデータセットは5文のストーリーを含む約9,000セットからなるデータセットである.結末文の否定と肯定を入れ替え,新たな結末文を作成するなどして,大規模言語モデルが正しい結末文を選択できるかという実験等を行った.本実験の結果,現在の大規模言語モデルの一部は日本語で書かれたストーリーの否定理解が困難であることがわかった.今後の課題として,ストーリー理解のための因果関係に関する実験及び生成モデルを用いたDanStoデータセットの自動拡張が挙げられる.

  • レース前半の走行フォーム特徴量を用いた検討
    宮崎 陽輔, 阿部 悟
    セッションID: 4Xin2-58
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    フルマラソンにおいて,レース後半に意図せず生じる大幅な失速は「30 kmの壁」と呼ばれ,参加者の3割ほどが体験するにも関わらず,その詳しい機序は明らかになっておらず,レース中の対策と記録を狙うことの両立は容易ではない.本研究では,「30 ㎞の壁」の発生有無を,フルマラソン本番のレース前半における走行フォームの特徴量から予測することを試みた.接地時間やスティフネスなどの走行フォーム特徴量は,レース本番環境下でもウェアラブルデバイスにより測定しやすいことに加え,心拍などの生理学的な指標に比べて主観的な疲労度の小さな変化にも反応しやすいことが報告されており,失速の発生する予兆が現れる特徴量と考えた.用いたデータセットは,異なる複数のフルマラソンにおいて,6軸モーションセンサと地磁気センサを内蔵した小型デバイスを腰部に装着した延べ336名の計測データとした.予測モデルの構築には,説明変数としてレース前半15 kmまでの走行フォーム特徴量を,目的変数としてレース後半の大幅な失速有無を示す2値データを用いた.ロジスティック回帰の分類精度をベンチマークに,深層学習手法等を用いた場合の比較結果を紹介する.

  • 奥井 宣広, 福嶋 昌太郎, 窪田 歩, 吉田 琢也
    セッションID: 4Xin2-59
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    IoTデバイスの普及に伴い,IoTデバイスを対象としたサイバー攻撃は増加傾向にあり,異常通信検知手法の更なる高度化が求められている.異常通信検知で用いるデータ形式としては,スケーラビリティの観点からパケットデータをセッション単位の統計量に集約したフローデータが注目されているが,パケットデータと比較し情報量が大きく減少するため,検知精度向上が課題である.近年では,自然言語処理技術を応用した異常通信検知手法が提案されており,フローデータの順序的な特徴を考慮することで精度向上につながることが報告されている.しかし,先行研究の手法ではフローデータを単語と見なす際に行われる離散化により統計情報が失われ,統計的な違いが重要である異常通信を検知できない.本研究では,Vector Quantization VAE(VQ-VAE)による離散化とTransformerによる自己回帰学習を組み合わせた異常通信検知手法を提案する.公開されているIoT通信データセットを用いて実験を行い,ROC-AUC:0.688と従来手法と比較して精度が向上することを確認した.

feedback
Top