人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
選択された号の論文の939件中701~750を表示しています
  • 楓 紘希, ジメネス フェリックス, 宮本 友樹
    セッションID: 4E1-GS-8-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年, さまざまな人の教育を支援する教育支援ロボットが研究開発されている.本研究では問題を解きながら共に学ぶロボットに注目する 従来ロボットでは, 学習者はロボットから提示された問題数を解答する能動的な学習環境が多い. 一方, 学習者の学習意欲および学習効果を高めるためには, 自分から解答する問題数(解答問題数)を決めるような 自発的な学習が重要である. そこで本研究では, 自発的な学習を促すために,学習者と会話しながら解答問題数を交渉する問題数交渉手法(以下, 提案手法)を提案する.本稿では, 従来ロボットと比較しながら, 提案手法を搭載したロボット(提案ロボット)が中学生に与える解答問題数の変化を調査する. 実験結果から, 提案ロボットとの共同学習において, 中学生の解答問題数が従来ロボットに比べて向上することが示唆された.

  • 大日方 慶樹, 塚本 直人, 河原塚 健人, 金沢 直晃, 岡田 慧, 稲葉 雅幸
    セッションID: 4E1-GS-8-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    生活支援ロボットの重要性は高く,特に人の移動を伴うタスクを代替するおつかいが求められている.移動先でタスクを行うときに,タスク現場ではタスクに応じた情報の収集と収集した情報に基づく動作が求められる.本研究では,ロボットタスクの動作記述に,情報を収集して動作を具体化することを明示する構文を追加し,その情報収集に大規模視覚-言語モデルを導入することによって,ロボットの確定的動作と現場判断を両立するシステムを提案する.またロボットによる実機実験によって本システムの有用性を示した.

  • 石川 育恵, ジメネス フェリックス, 三谷 真優, 中島 卓裕, 吉田 翔子
    セッションID: 4E1-GS-8-05
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年,通常学級における発達障害児の割合増加に伴い、臨床心理士の需要も増加している。知能検査の実施訓練では、児童を対象とした実演や大人同士のロールプレイングで児童を演じて訓練している。しかしながら、訓練対象者を常に確保するのが困難であるため、臨床心理士は十分な訓練を実施できない。そこで本研究では、臨床心理士から知能検査を受ける児童型ロボット(以下、提案ロボット)を開発する。提案ロボットには,知能検査を受けている児童と同様な発話内容が搭載されている.臨床心理士はロボットとの会話を通して知能検査を訓練する.本稿では,臨床心理士の提案ロボットとの訓練に対する印象を調査する.臨床心理士に対してアンケート調査を実施したところ,提案ロボットとの訓練は,「魅力度」「効率度」「新規性」の観点から好印象であると示された.

  • 笹井 勇亮, 奥村 亮太, 堀江 孝文, 萩原 良信, 谷口 彰, 谷口 忠大
    セッションID: 4E3-GS-8-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    人間はコミュニケーションの相手に応じて態度を変化させている.相手の意見に対する受け入れやすさをベイズ推論に基づく受容確率として数学的に表現した理論にメトロポリス・ヘイスティングス名付けゲーム(MHNG)がある.先行研究では,MHNGから受容確率に関する制限をなくした共同注意名付けゲーム(JA-NG)による被験者実験により,MHNGが人間の受容確率を説明する理論として有効であることが示された.一方で人間の受容確率には受容しやすいといったバイアスがあることも示唆された.本研究ではバイアスに関する洞察を得るために相手エージェントに対する認識がバイアスに影響するかを調査した.実験としてはチューリングテスト含めたJA-NGの被験者実験を行い,相手が人間であるかコンピュータであるかの評価に基づいてバイアスを分析した.その結果,相手を人間と認識する場合とコンピュータと認識する場合の受容確率におけるバイアスに有意な違いは見られなかった.また,人間のコミュニケーションを通じた記号創発のモデルとして提案されたMHNGが他のコンピュータモデルと比較して人間であると評価されにくい傾向が見られた.

  • 佐藤 萌日, 三方 瑠祐, 境 くりま, 住岡 英信, 船山 智, 港 隆史, 石黒 浩, 佐久間 海土, 菊池 あかね, 堀部 和也
    セッションID: 4E3-GS-8-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    ロボットとの非タスク志向対話において、ロボットと人間の身体動作の模倣や動きの同調が円滑なコミュニケーションを実現するうえで重要であることがわかっている。本研究では、非言語インタラクションに焦点を当てたインタラクションの実験を行った。本研究では、ロボットと身体動作を介して空間表現のフィードバックが来るインタラクションシステム、「SHOSA」を使って約5分間身体動作のみでロボットとインタラクションを図る。実験ではこのインタラクションを通じてロボットとの親密性やインタラクションの感想をアンケート調査し、ロボットと人の身体動作について手先の動きや姿勢の相関関係を移動エントロピーを用いて解析を行った。以上のアンケート調査による主観調査と身体動作を用いた移動エントロピーについての相関について検討を行う。

  • 梅田 拓実, 加納 政芳
    セッションID: 4E3-GS-8-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本稿では,ロボットの歩行動作に変化をつけることなく,同一動作で歩行するロボットが歩容に関するオノマトペを発することによって印象が変化するか検証する.擬態語・擬音語は音象徴性が高いことから,擬情語ではなく擬態語・擬音語を用いることで,歩容オノマトペの印象を定式化できると考える.事前実験によって14種類のオノマトペを選定し,ロボットの外見と声質の違いによる印象変化を考慮して,2種類のロボットと4種類の声質を用意し,オノマトペの印象ならびに感情表出効果をアンケートにより調査した.アンケート結果をクラスタ分析したところ,14種類のオノマトペを4つのグループ(忙しいオノマトペ,力強いオノマトペ,かわいらしいオノマトペ,元気のないオノマトペ)に分類できた.各グループのアンケート結果の平均値に対して多重比較を行った結果,力強いオノマトペは大きさ・安定感の印象を付与すること,かわいらしいオノマトペは柔らかさ・丸さの印象を付与すること,元気のないオノマトペは悲しみの印象を付与することが示唆された.

  • 福井 崚太, 湯口 彰重, 松本 吉央, 岡留 有哉
    セッションID: 4E3-GS-8-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    急速に発展が進む大規模言語モデル (LLM) は、人間に近いレベルでの発話生成を可能にしつつある。こうした発話生成の技術を対話ロボットに応用することで、人間と長期的に関係を継続できる対話ロボットの開発が期待される。本研究では、自然な雑談対話の長期にわたる継続を目指した、LLM に基づく実時間音声対話ロボットシステムを開発する。提案システムでは、長期的な雑談対話を想定し効率的に対話履歴を参照するため、2 種の対話要約情報を組み合わせて発話生成に利用するプロンプトを設計した。要約手法は、言語モデルを利用した生成型要約により対話履歴を圧縮することに加え、名詞抽出型要約により対話履歴に含まれる話題を補完する。提案手法をアンドロイドを用いた実時間音声対話ロボットシステムとして実装した。対話履歴参照機能の有無を比較条件として、アンドロイドロボットとの雑談対話に対するユーザ評価実験を実施した。その結果、提案手法に基づく参照機能は、ロボットが話を理解したという印象に寄与する可能性が示唆された。

  • 佐々木 康佑, 西川 純平, 森田 純哉
    セッションID: 4E3-GS-8-05
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    人間は,思考能力を持っているかのように振る舞う人工物に対してエージェンシーを知覚する.我々は,エージェンシーの知覚が喚起される人工物の実現には,記号と数量の変換機構により生成される身体動作を行う人工物が人間に知性を感じさせる必要があると考える.そこで,本研究では「単語分散表現のベクトル空間から抽出された数量的意味によって生成されるジェスチャーは,エージェンシー知覚を喚起する人工物の構築を可能にするか」というリサーチクエスチョンを検討することを目的とする.本研究では筆者らの先行研究において提案したロボットのジェスチャー生成手法を用い,実験を行った.実験においてはHuman-Robot Interaction(HRI)におけるロボットの主観評価に用いられるGodspeed Questionnaireを利用してCo-speechジェスチャーを行うロボットの知性に関する評価を実施した.その結果,提案手法はエージェンシー知覚を引き起こす要因であるとは示されなかった.今後は本手法を拡張することで,エージェンシー知覚を引き起こし,人間との自然なインタラクションを実現する新たな人工物の開発を目指す.

  • 福田 晋太郎, 古崎 晃司
    セッションID: 4F1-GS-3-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    Entity Linkingは、文章中のエンティティとナレッジグラフ上のエンティティを紐付ける技術であり、情報検索や質問応答システムの基盤技術として注目されている。事前学習なしEntity Linkingにおいて、使用するリソースによる性能への影響は大きい。本研究では、リソースにWikidataを用いた事前学習なしでの日本語Entity Linkingシステムを構築し、Wikidataを対象としたEntity Linkingにおける性能のベースラインと課題を調査する。また、Wikidataの構造を用いることで、リンキング性能が向上するかについても検証する。 検証した結果、本システムは6割程度の精度があることを確認した。また、Wikidataの構造を用いることがリンキング性能向上に寄与することを示した。

  • 井手 綾乃, 井田 安俊
    セッションID: 4F1-GS-3-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    知識グラフ補完タスクは, 学習中に観測したエンティティやリレーションに対して埋め込みを算出し, 欠損トリプルを推測することを目的としたタスクである。ほとんどの知識グラフ補完手法では十分なデータ数を持つ知識グラフのみを想定しているため, エンティティやリレーションの出現数が少ない場合, 出現しない場合に推測することができない。しかし, 実世界の知識グラフは動的なもので, 逐次的に新たな知識が加わり, さらに新たなエンティティやリレーションが追加される。 そこで本論文では少量のデータで学習し、新たなエンティティやリレーションに対しても埋め込みを作成しかつ知識グラフ補完ができるようなモデルを構築した。実験では, 既存の知識補完モデルに精度は劣った、マルチホップなリレーション間の関係性をモデル化することで精度向上につながる可能性があることが実験的に確認できた。

  • 山田 隆弘
    セッションID: 4F1-GS-3-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    工業製品の開発においては、仕様書、計画書、手順書等の様々な技術文書が使われる。これらの技術文書は、通常は、日本語や英語等の自然言語を用いて記述される。一方で、人間の知識を機械で処理できるようにするために知識グラフという技術が開発されている。技術文書を知識グラフとして表現することができれば、技術文書を機械的に処理することが可能になり、開発の様々な局面で効率化を図ることが可能になる。本発表では、様々な技術文書を知識グラフとして表現するための方法を提案する。技術文書の内容には、チーム構成やスケジュール規定のようにデータ主体のものと手順の定義のように順序的な記述主体のものとがある。前者のものに対しては、関係データベースの設計方法を用いることによって知識グラフを構築する。後者のものに対しては、筆者が2022年の本大会で発表した談話(複数の関連した文の並び)を知識グラフとして表現するための方法を応用して知識グラフを構築する。これらの方法を組み合わせて用いれば、様々な技術文書の内容を知識グラフとして表現することが可能となり、技術文書を機械的に処理することが可能となる。

  • 堀本 隆誠, 岡田 真, 森 直樹
    セッションID: 4F1-GS-3-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年, 人工知能技術の急速な発展の中, 人間のさまざまな知識を体系的に連結してその関係をグラフ構造で表現する Knowledge Graph は強い注目を受けており, 人工知能の基盤技術としてさまざまな分野で活用されている. その中で既存の Knowledge Graph に新たな知識を付加する要求が生じた際のために Knowledge Graph の自動補完手法が希求されている. 従来の Knowledge Graph 補完手法である TransE や ComplEx などの問題点として, 知識の関係性を重視して学習しており, 知識自体の意味情報を効果的に捉えていない点がある. 本研究では, 知識自体の意味情報を効果的に捉えるために深層言語モデルである BERT による Masked Language Modeling を用いた Knowledge Graph 自動補完手法を提案して, 評価実験によりその有効性を検証した.

  • 櫛田 達矢, 申 在紋, 臼田 大輝, 山縣 友紀, 高田 豊行, 小林 紀郎, 藤原 豊史, 桝屋 啓志
    セッションID: 4F1-GS-3-05
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    疾患モデル生物とは、疾患を研究するために遺伝的に操作された生物や突然変異体のことを指す.これらは特定の疾患を再現するように設計されており、疾患メカニズムの解明、治療法の開発に不可欠である.これまでに我々は, 7828件の実験マウスから疾患に関連する遺伝子の情報を用いて1208種類の疾患に対応する1938件の疾患モデルマウスの候補を選抜してきた.ただしこの方法では,疾患関連遺伝子の情報を持たない疾患に対して,疾患モデルマウスを見つけることができない欠点があった.本研究では,4438件の実験マウスが示す表現型用語(例,蕁麻疹)の関係データと,疾患と表現型用語の関係データを用いて,集合類似度とTF-IDFコサイン類似度を算出,これらをRDF化,知識グラフを作成,SPARQLで検索可能にし,表現型情報を用いた疾患モデルマウスの推定を行った.その結果,203種類の疾患に対応する239件の疾患モデルマウス候補を見つけることができた(コサイン類似度 0.5以上).これらのうち,疾患189種類(例,好塩基球減少症)とそれに対応する疾患モデルマウスの候補179件は新規に発見されたものであった.

  • 浅川 賢史, 宮澤 昇吾, 吉田 祐樹, 北西 由武
    セッションID: 4F3-GS-3-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    女子学生アスリートを対象とした先行研究において「体調記録は体調管理に意義がある」という結果が得られ,日々の記録管理が推奨されている.それを受けて自社ではソフトボール選手が体調の記録・確認・連携をデジタルに行えるセルフチェックシステムを構築している.本研究は本システムが選手の体調管理に有用かの定量評価を目的とした.体調(0-100の連続値)に対して蓄積されたデータから得られた体調への影響因子の意識の度合い(意識有,無)の要因の反復測定分散分析を行った結果、その因子が体調へ影響していたことが示唆された.またデータ入力の回答率をモチベーションの高さとし,モチベーションの高い群,低い群において体調が悪い状態になった翌日の体調の変化量に対するモチベーション群の要因の反復測定分散分析した結果,有意差が得られた.このことからシステムで体調管理を行う意義を感じ,モチベーションが高い群は体調管理の効果が高いことを確認した.以上より本システムの体調管理への有用性が示された.

  • 宿利 雄太, 得津 慶, 藤本 賢治, 松田 晋哉
    セッションID: 4F3-GS-3-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    精神疾患と死亡発生の間にある関係の解析によって,精神疾患を持つ患者の死亡発生率低減に繋がる可能性がある.しかしながら,臨床検査結果により精神疾患の状態を把握することは困難である.そこで,計算量を考慮しながら,処方薬剤の組み合わせによる死亡率解析を行うことを考える.本稿では,ベイジアンネットワークを用いて,薬剤の処方状況で潜在的な精神疾患の状態を表す方法を提案する.医療レセプトデータを利用した実験では,この潜在的な状態に基づき分岐条件候補を設定することで,既存手法と比べて,同程度の実行時間に対する決定木学習のスコアを高めた.我々の提案方法は,複数の観測変数の組み合わせがアウトカムに影響を与える潜在的な状態を表す状況に対する解析に利用可能である.

  • 中村 真士, 岩松 秀俊, 伏屋 貴文, 服部 雅典, 速水 悟, 寺田 和憲
    セッションID: 4F3-GS-3-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    企業内で日々蓄積される労働災害の報告書は,原因分析,再発防止策の策定,安全教育などに利用することができる.しかし,これらのテキストデータは構造化されておらず,効率的な知識の蓄積と再利用を阻む原因となっている. 本研究ではこれらの文書を構造化し,再利用可能な有益な知識として蓄積することを目的とした. 本実験では,電力会社で発生した労働災害の報告書に関するテキストデータに対し,汎用LLMであるGPTを用いてテキスト含意を基にしたマルチラベルアノテーションを計4つのアプローチで行った.またアノテーションタスクに使用する事故の原因の抽象カテゴリ自体もゼロショットでGPT-4から抽出し,それを人間の専門家がチェックをすることでラベルを決定した. 実験の結果,特にプロンプトエンジニアリングを用いたワンショットのアプローチにおいて,GPTは強力な一般化能力を発揮し,一部の評価指標において人間のアノテーターと同じレベルに肉薄する有望な性能を示した. しかし同時に,本研究のように専門性が高く,多面的複数の要素が絡まりあう事例を扱う際は,モデルの選択やプロンプト設定に慎重な調整が求められることも示唆された.

  • 水沼 千枝, 池谷 知子, 黒崎 優美, 野手 紀花, 奥村 紀之, 上 泰, 花田 美和子
    セッションID: 4F3-GS-3-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    ファッション産業は原材料の調達から廃棄まで環境負荷が大きく、この問題解決は国際的な課題である。環境省の調査によると家庭ごみで排出された衣料品のうち95%が焼却と埋め立て処分されているのが現状である。本研究は不要になった衣料品が、再利用可能なレベル(リユース)あるいは、廃棄するレベル(リサイクル)の判断をAIによって自動で行うシステムを構築し、廃棄される衣料品を削減する仕組みを作る。 本報告では、リユースあるいはリサイクルのボーダーラインに位置する衣料品に関するオープンなデータセットが存在しないため、機械学習に必要な衣料品画像のデータセットの作成方法について述べる。画像は、主に低価格帯の商品を扱うリサイクルショップで回収された衣料品を用い、これを一点ずつ解像度の異なる複数のカメラで多方向から撮影し、延べ14,105枚のデータを得た。また、商品の仕分け担当者と商品仕分けの知識のない人それぞれに、商品のリユース・リサイクルの仕分け作業とその根拠の聞き取りを行い、収集した画像にタグ付けを行った。さらに社会実装に向け、リユース可能な衣料品同士をコーディネートして提示するシステムを検討した。

  • 藤井 萌惠, ウィリアムソン 彰子, 笹嶋 宗彦
    セッションID: 4F3-GS-3-05
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    看護教育の現場において,看護学習者は看護過程を展開する能力を身に付けるために,グループで看護・病態関連図を作成する演習を行っている.本研究では,この演習を指導者が採点する際に個人を適切に評価することが困難であるという課題に対して取り組む.具体的なアプローチ方法としては,グループでの看護・病態関連図の作成にオンラインツールを使用することで,ツールから取得可能なログデータを用いて個人の貢献度をはかる.実際に看護学習者にツールを使って演習に取り組んでもらい,作業量に着目した貢献度モデルにしたがって個人貢献度を算出した.この実験の結果,実際の演習現場に関する知見を得られた.今後は,指導者の個人評価基準をもとに,関連図の内容に着目した貢献度モデルの改良と評価を行いたい.

  • 増田 俊太郎, 山﨑 俊彦
    セッションID: 4G1-GS-4-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    SNSの普及により,企業や個人が人気を獲得することの重要性が増してきている.人気についてより深く理解するため,popularity analysisの分野では様々な人気の予測モデルが提案されている.しかし,多くの先行研究では分析対象が単一の画像や動画などに留められており,それらのコンテンツの投稿元であり上位の概念であるSNSアカウントを対象とした人気分析手法は確立されていない.よって本研究では,SNSアカウントを対象とし,それらに紐づくアカウント情報・テキスト・画像・動画などのマルチモーダルな特徴量を入力として,人気推移を予測するモデルを提案する.実社会データを用いて予測実験を行った結果,ベースラインと比較して相対的に劣るものの,このタスクにおける改善の余地と方向性を示すことができた.

  • 貴舩 怜士, 新美 礼彦
    セッションID: 4G1-GS-4-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本論文では、異常検知技術を用いてプレスリリーステキストから固有表現を外れ値として抽出する手法を提案し、その有効性を検証する。本研究で得られた固有表現を最終的には企業研究へ応用することを検討する。ここでは異常検知技術として、データの密集度に基づいて異常度をスコアリングするLocal Outlier Factor (LOF)を採用した。この手法は、高い次元数でも優れた性能を発揮することが確認されている。具体的な手順としては、まずプレスリリーステキスト全文を事前に学習したFastTextを使用し、プレスリリースに出現する名詞をベクトルに変換する。FastTextは、未知語に対する高い対応力を持つことから採用している。次に、取得したベクトルをLOFへ入力し、外れ値として検出する。実験では、外れ値としてIREXが定める8種類の固有表現をそれぞれ抽出できていることが確認できた。しかし、外れ値の中には、固有表現の定義から逸脱するワードやノイズが多く含まれていた。

  • 松本 涼花, 中西 映人, 大友 直史, 田村 光太郎, 塩崎 潤一, 佐野 幸恵
    セッションID: 4G1-GS-4-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究では、POMS(Profile of Mood States)に基づく独自の感情辞書を新たに構築してTwitter(現 X)からデータを抽出し、日本人の集合的な感情を捉える新たな指標、「日本の空気感指標」を開発した。本指標は、社会的出来事の影響を反映した変動を示し、自然災害やロシアのウクライナ侵攻の際には、「心配」や「混乱」を表す指標に変化がみられた。Prophetモデルを用いて、本指標の変動を分析したところ、長期的傾向、年周期性、週周期性の明確な変動パターンが特定された。本指標を用いることで、直接測定することが困難な社会の空気感を定量的かつリアルタイムに捉えることを可能となるため、COVID-19パンデミックのような事象への応用も考えられる。将来的には本指標を用いることで、企業が消費者の感情傾向やニーズを把握し、マーケティング戦略やPR戦略を立てることも期待できる。

  • 大野 航生, 濱崎 雅弘, 中野 倫靖
    セッションID: 4G1-GS-4-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    SNSやWebサイトはファッションアイテムの選択において欠かせない情報源となっている.そこで本研究では,SNSとWebサイト上のブランド情報とコーディネート情報を用いたファッション探索支援システムを提案する.提案システムでは,コーディネートに関する人々の評価,コーディネートでの用いられやすさ,ファッションメディアやEコマースサイトでの扱われ方,という3つの観点からブランドを特徴付ける.これら異なる観点を活かした探索支援インタフェースにより,ユーザの好みと周囲の評価のバランスが取れたファッションコーディネートの発見を支援する.

  • 西口 真央, 鳥海 不二夫, 河尻 耕太郎, 吉田 光男
    セッションID: 4G1-GS-4-05
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年のSNSやニュースメディアの普及により,社会情勢や流行,季節性のような社会環境がこれまでにないスピードで消費者行動の変化をもたらしている。特に,安価な嗜好品や日用品の需要は社会環境の影響を大きく受けることがあり、小売店や製造業者にとっては変化の兆候を迅速に特定することが重要である.本研究では,複数の大型小売店舗のPOSデータおよびSNSデータを使用し,代表的な嗜好品の一つである缶ビールの需要予測モデルの構築を行う.提案手法では,SNSの投稿テキストから社会環境の変化を抽出した特徴量の抽出方法を提案している.実験の結果,提案手法によって得られた特徴量が売上データのみを入力とするモデルの予測性能を向上させることを確認した.

  • 東 大介, 鷲尾 隆
    セッションID: 4G3-GS-2-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究では,対象の事前知識に基づき,原因変数を説明変数,結果変数を目的変数とする近似物理モデルMpと,そのモデルの目的変数推定値と対象から得られる目的変数観測値との残差を推定する統計的残差回帰モデルMsを用いて,Mrの説明変数の重要度から,対象構造の未知メカニズムに関わる説明変数を推定する手法を提案する.対象に関して,近似物理モデルMpで捉えきれない残差を残差モデルMrが学習するため,Mrは近似物理モデルに含まれていない対象の未知メカニズムに関する情報を含んでおり,Mrにおいてその情報をもたらす未知メカニズムに関わる説明変数の重要度が高くなる.本手法を雨水貯留タンクシミュレーションに適用し,対象の未知メカニズムに関わる説明変数を推定可能であり,またMpとMrの組み合わせによってより高精度な目的変数値を推定できることを確認した.

  • 三宅 陽一郎, 安藤 颯汰, 福地 昂大
    セッションID: 4G3-GS-2-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    PCG(プロシージャル・コンテンツ・ジェネレーション)は計算によってコンテンツを自動生成することであるが、特にマシンラーニングを用いた手法をPCGML(Procedural Contents Generatiaon via Machine Learning)、強化学習を用いた手法をPCGRL(Procedural Contents Generatiaon via Reinforcement Learning)と言う。これは自動生成するエージェントを強化学習する手法である。本研究は、エージェントに3次元仮想空間において、カフェの中の椅子・机を配置させ、その評価をエージェントにフィードバックすることで強化学習を行った。結果として、報酬関数によってカフェにおける多様な机と椅子の配置を制御する手法を実現した。

  • 横山 友也
    セッションID: 4G3-GS-2-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    インターネットの急速な普及に伴って様々なウェブサービスが提供されており、その中でも質問回答サイトの利用者が増加の一途を辿っている。質問回答サイトとは、インターネット上でユーザ同士が互いに質問と回答を投稿しあうコミュニティの一形態であり、種々の悩み事・相談事を解決する場であると同時に、膨大な知識が蓄積されたデータベースとして活用されるようになってきている。しかし、利用者が増加するにつれ、適切な回答が得られないことで損害を被る状況が発生する等、社会的に大きな問題となってきている。そこで、質問回答サイトにおける質問者と回答者のミスマッチングを解消し、質問文に適切な回答ができるユーザを引き合わせる手法の開発を目的とした研究を行っている。これまで、印象評価実験を通じて9因子を獲得している。本論文では、実験に使用した60件の質問回答文の因子得点を目的変数、2種類の構文解析(形態素解析・N-gram)を通じて抽出された文章の特徴量を説明変数として、いかなる文章の因子得点の推定を重回帰分析で行った。その結果、形態素解析・N-gramどちらの場合においても良好な推定結果が得られた。

  • 和田 幸志郎
    セッションID: 4G3-GS-2-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本研究では、大規模言語モデル(LLM)を使用したRAG (Retrieval-Augmented Generation) とSelf-Refineを統合することで、自動化された高品質なクイズ生成システムを提案する。RAGは、Wikipediaなどの外部データベースから関連情報を収集し、これをGPTへのプロンプトとして活用する。一方、Self-Refineメカニズムは、初期出力されたクイズに対してLLMを用いてフィードバックを生成し、そのフィードバックを基にクイズを反復的に改良する手法である。本システムの主な目的は、精度と関連性の高いクイズを効率的に生成することであり、その成果は人手評価で検証された。実験結果は、Self-Refineメカニズムが初期のクイズ生成プロセスを著しく改善し、高品質なクイズの作成を可能にしたことを示した。

  • 田中 孝明, 大坪 舜, 伊藤 孝太朗, 畠山 卓也, 安齋 佑司, 長坂 知明, 松井 崇, 石川 信行
    セッションID: 4G3-GS-2-05
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    大規模言語モデル(LLM)マルチエージェントシステムは, 複数のAIエージェントが協力や競争を通じて複雑なタスクを達成するシステムである. これらのシステムの応用例としては, 質疑応答の正答率向上, 現実世界の相互作用のシミュレーション, ソフトウェア開発における業務自動化など多岐にわたり, 個々のエージェントのロールやコミュニケーション形態の最適化などが一つの重要な研究領域となっている. 近年のLLMの発展に影響を受け, ヒューマン・コンピューター・インタラクション(HCI)の分野における, 創造性支援ツール(CST)においてもLLMを活用したものが増加している. 本研究では, LLMマルチエージェントシステムを用いて, 新規事業開発や新製品開発におけるアイディエーションを行うCSTを開発した. 開発したCSTを用いてエージェントの設定等の入力条件を変化させ, 出力されるアイデアの変化や人間によるアイデア群との差異を測定したところ, 出力されるアイデアの多様性に一定の傾向があることが判明し, アイデア評価の新たな手法につながる示唆が得られた.

  • 久保田 祐貴, 吹上 大樹
    セッションID: 4I1-GS-7-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    奥行き推定技術は,深層学習の発展とともに精度が飛躍的に向上してきた.こうした深層モデルの性能を評価する基準の一つに,人の知覚との整合性が挙げられる.物体認識や質感に関する人と深層モデルの比較研究は存在する一方で,奥行き推定モデルに対しては行われてこなかった.本論文では,その比較を実現するため,人の自然画像に対する奥行き応答のデータセットを収集した上で,精度と誤差一貫性の観点から,単眼奥行き推定に対する人と深層モデルの応答を比較した.2点の遠近関係を回答するタスクにより比較した結果,34種類のモデルのうち27種類のモデルで人(0.708, 95%CI: [0.702, 0.713]よりも精度が高い(真値に近い)応答を示した.しかし,実験参加者間の誤差一貫性(0.447, 95%CI: [0.427, 0.465])に対して,全てのモデルで人の評価との一貫性が低かった.特に,複数のデータセットを利用することや,評価対象画像と同じ(i.i.d.の)データセットを訓練に用いないことが,人の評価との誤差一貫性を高める可能性が示唆された.

  • 丹治 直人, 山崎 俊彦
    セッションID: 4I1-GS-7-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    効果的なオンライン広告の作成のためには, 配信前に広告効果を予測することが有用である. ウェブ上で配信されるディスプレイ広告画像は多様なアスペクト比を持っており, アスペクト比を変えるような前処理は人が画像を見たときの印象も変えてしまうため, 正確な広告効果の予測のためにはアスペクト比の情報を保持してモデルに入力することが重要だと考えられる. 本研究では, 任意のアスペクト比の画像を扱うことができるVision TransformerモデルをMasked Autoencoderの手法を用いて広告画像で事前学習することで, 広告画像専用の画像認識モデルを作成した. Rotary Position EmbeddingとFlash Attentionを活用することで, 入力画像サイズに対する柔軟性が高いモデルが得られた. 事前学習モデルを実際の広告配信データを用いたクリック率予測タスクに適用した結果も示す.

  • 小槻 誠太郎, 飯田 紡, デュブレ フェリックス, 平川 翼, 山下 隆義, 藤吉 弘亘, 杉浦 孔明
    セッションID: 4I1-GS-7-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    深層学習が幅広い分野に応用されている現代において,深層学習モデルの説明性は重要であり,透明性の高い説明生成が望ましい.透明性の高い説明生成手法として寄与度を逆伝播して説明を生成するLayer-wise Relevance Propagation (LRP) が挙げられるが,本手法はスキップ接続を持たないモデルのみに適用されており,スキップ接続を持つモデルに適用すると保全特性が満たされず,説明の品質も悪い.そこで本論文では,スキップ接続を持つモデルにおける保全特性を満たした寄与度の逆伝播の計算方法を提案し,LRPをスキップ接続を持つモデルに適用できるよう拡張したLRP for ResNetを提案する.CUB-200-2011データセットにおいて評価を行い,提案手法は保全特性を満たしつつ,Insertion ScoreおよびDeletion Scoreにおいて既存手法を上回った.

  • 橋野 真, 松原 崇
    セッションID: 4I1-GS-7-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    拡散モデルなどの深層生成モデルは,テキストから高精度な画像を生成することを可能にしているが,テキストによって画像の一部分を所望の内容に変更させる画像編集も重要なタスクとなっている.拡散モデルを用いた画像編集は,入力画像に対応する初期ノイズへと変換するinversionを行い,その後テキストによる条件付けで編集画像を生成するというのが主な手順である.だが,これでは意図しない部分まで変化してしまうことが知られている.既存手法では,初期ノイズから画像生成を行う過程の途中に操作を加えることで所望の内容のみ編集することを可能にしている.しかし,生成過程の途中に操作を加えることによって,不自然な画像を生成してしまうケースも見受けられる.この課題を解決するため本研究では,生成過程の初期ノイズを編集対象のものへ最適化することを提案した.具体的には,初期ノイズにおいて入力画像の単語に反応していた部分を編集対象の単語に反応させるように最適化させ,その後事前訓練済みの画像生成モデルによって編集画像を生成させるという手法である.この手法によって,既存手法と比較し,より自然な編集画像が生成されることを示した.

  • 赤木 稜, 松原 崇
    セッションID: 4I1-GS-7-05
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    Neural radiance fields (NeRF)とはさまざまな角度から撮影した複数の画像をもとに,任意の視点からの画像を生成する技術である.新しい視点からの画像を生成するのにはボリュームレンダリングを用いており, 任意の視点からの光線に沿って積分を評価する必要がある.レンダリングの積分には各光線上の密度と色の情報が必要となるが,実装上では, 光線上に複数のサンプリング点を設定し,離散化して計算することで積分値を近似している.既存手法においては, 計算の高速化のために簡略化された数値積分を用いており,サンプリング点における値に依存しやすい近似値となっている.そのため出力される画像の鮮明さが犠牲になっている可能性がある.本研究ではレンダリングの近似値の精度をより高めるために, この積分を微分方程式として捉え,ルンゲクッタ法を用いて積分値を近似した.これによって既存手法と同じサンプリング点の数の情報から,画像の鮮明さがどのように変化するか検証した.

  • 西本 聡
    セッションID: 4I3-GS-7-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    既存の2枚のCT画像から中間スライス画像の作成を試みた。顔面骨骨折CT収集プロジェクトで蓄積された画像を使用した。1/3リスライスシステムでは、画像位置順に並べ、1番目とと4番目の2枚の画像を重ねたもの(512x512x2)を入力とし、1/3位置と2/3位置で重ねた画像(512x512x2)を対応する出力として収集し、U-netで学習した。同様に、1/4リスライスシステムは3枚の画像を重ねたもの(512x512x3)を出力として学習し、1/5リスライスシステムは4枚の画像を重ねたもの(512x512x4)を出力として学習した。これらのシステムは、視覚的に大きな問題のない画像を生成した。

  • 斉藤 功樹
    セッションID: 4I3-GS-7-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    瞬目はコミュニケーションや様々な場面で重要な役割を果たす.しかし,個人ごとに目の形,瞬目の頻度,及び瞬目の持続時間などが異なり,精度よく瞬目を検出することは容易ではない.そこで,本論文ではビデオ動画を基に個人差を考慮した瞬目検出手法を提案する.本手法では,ビデオ動画から検出された3D landmarkを基にEye Aspect Ratio(目の開き具合を表す指標)を計算し,個人ごとに最適化されたEye Aspect Ratioの閾値を算出する.既存データセットを用いて本手法を評価したところ,既存研究と比べてAccuracy,Precision,及びF1-scoreが向上した.3D landmarkを用いることで顔の動きに対してロバストなEye Aspect Ratioを計算でき,個人最適化されたEye Aspect Ratioの閾値を用いることで個人差の問題を解決できたと考える.

  • 山路 和希, 高木 友博
    セッションID: 4I3-GS-7-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    Large Language Models(LLM)の卓越した言語処理能力に刺激を受け、近年、複雑なマルチモーダルタスクの性能向上を目的として、強力なLLMを組み込んだ Large Vision Language Models(LVLMs)の開発が進められている。 しかし、これらLVLMsには、不適切な認識により、画像内に存在しない物体や物体同士の間違った関係性を記述してしまう問題(Object Hallucination)が存在する。 そこでこの問題に対処するため、我々は、Object Hallucinationを検知し、修正を行うフレームワークを提案する このフレームワークでは、LVLMs内のAttention Mapや勾配情報などを元に、Object Hallucinationが発生する原因となった画像の特定部分を特定・検知し、その修正を行う。 実験を通じて、提案手法によりObject Hallucinationの発生が軽減されることを、複数の定量的指標を用いて確認した。

  • 横川 優, 太田 和宏, 水俣 友希, 川崎 洋, 長原 一, 小野 智司
    セッションID: 4I3-GS-7-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    符号化開口は,通常は円形であるカメラの絞り部分の形状を,2次元の複雑なパターンに置き換える技術である.本研究は,符号化開口の用途拡大を目的とする.符号化開口技術は,タスクに応じて開口形状を設計する必要があり,ボケ除去や深度推定等を可能とする特徴を持つ.本研究では,情報秘匿用の符号化開口の設計方式を提案する.提案する手法は,情報秘匿に適した開口形状およびカバー画像に付与する摂動パターンを,多目的遺伝的アルゴリズムにより同時に設計する.秘匿情報が含まれた画像をランダムドットのように見えるカバー画像で隠し,摂動付与と逆畳み込みを行うことで,合焦距離における秘匿情報の被視認性を最小化する.これにより,焦点距離外にある撮影距離において,特定の開口(鍵開口)を用いて秘匿化画像を撮影したときにのみ秘匿情報が復号可能となる.また,鍵開口以外の開口では復号精度を最小化する.実験により,合焦距離において秘匿情報の視認が困難な秘匿化画像と,合焦範囲外の特定の距離において秘匿情報を復号可能な符号化開口の設計が可能であることを確認した.

  • 中村 悠人, 北森 迪耶, 下坂 正倫
    セッションID: 4K1-GS-9-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    複数のセンサデバイスを用いた行動認識は日常的に広く利用されており,センサデバイスが欠損した場合でも利用可能なシステムが求められている.既存の行動認識モデルはセンサ欠損のシナリオを考慮しておらず、いくつかのセンサデバイスが欠損した場合、性能は著しく低下する。センサ欠損に対するこれまでの手法では、非欠損なセンサデータを用いて生データや特徴量を補完するものである。しかし、これらの手法は、デバイスに大量の計算資源を必要とすることやデータセット固有の知識に依存することが課題となっている。そこで我々は、データセットに依存せず、欠損したセンサの任意の組み合わせに対応する、堅牢なアンサンブルベースの手法を提案する。2つの行動認識オープンデータセットを用いて実験を行い、提案手法の性能が複数のセンサ欠損時に既存手法を上回る認識精度を達成することを確認した。

  • 倉田 朋輝, 加納 政芳
    セッションID: 4K1-GS-9-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    VR空間で自身の代わりとなるアバタを自己と同一視することで生じる心理的・身体的変化をプロテウス効果という.我々の先行研究では,VR空間のみならず二次元ディスプレイに投影されたアバタによっても,スクワット運動時の主観的な疲労度が軽減することを示した.本稿では,主観的疲労度に加え,スクワット運動中の身体的な疲労度に変化が生じるか表面筋電を計測することで検証する.加えて,ディスプレイに表示されるアバタとして,被験者自身にとっての「理想に近いアバタ」を選択した際のプロテウス効果への影響を調査する.アバタ条件には「筋肉質」「非筋肉質」「アバタなし(自身の姿見)」を設け,理想的な体型を選択する群と選択しない群を用意し,比較した.その結果,主観的疲労度については,アバタを選択しない群において,先行研究同様,筋肉質アバタ条件は他の条件と比較して有意に低下傾向が認められた.一方で,身体的疲労度については,両群ともに有意差は認められなかった.このことから,理想的なアバタを選択せず,筋肉質アバタを用いることで,主観的疲労度が少なく,トレーニング効果が得られることが示唆される.

  • 村上 一真, 森 直樹, 岡田 真
    セッションID: 4K1-GS-9-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年,大規模言語モデル (Large Language Model, LLM) の向上を背景として、より高難度なタスクにおいて LLM を用いた顕著な成果が報告されている.しかしながら最も有力な LLM である GPT-4 は内部仕様が非公開であり,また LLM を独自に構築するには膨大なコストがかかるため現実的ではない.そのため,モデルの改良ではなくその振る舞いを対象とした研究が増加している.本研究では,LLM によって性能が飛躍的に向上したキャラクターとの対話に着目し,より現実世界との関連性が高くインタラクティブな会話の実現を目指した.今回はペルソナを指定し,視覚情報を仮定した周辺情報とキャラクターの内部状態に基づいて発話の有無を判定した.また,LLM を用いて周辺情報と内部状態からキャラクターの感情を数値的に評価した.LLM の評価した感情ベクトルと著者の判定を用いて,キャラクターの発話意志を感情ベクトルを入力とする二値分類問題として設定した. 実験結果として,感情の評価においてはペルソナを反映した評価値を得ることができた.また,発話の有無の判定はベースラインより有意な結果を得た.

  • 岡留 有哉, 中村 泰
    セッションID: 4K1-GS-9-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    人の動作のような多次元時系列データの生成タスクにおいて, モデルの訓練の際には各関節の位置のような空間情報に基づく誤差関数が用いられる. 生成モデル, 特に拡散確率モデルを適用する場合, ノイズ除去の繰り返しによりデータ生成を行う. このとき, 時系列データに含まれる微小振動など, 意味のある情報がノイズとみなされ除去されると考えられる. 本研究では, 拡散確率モデルの学習のため, 空間情報に基づく誤差関数に加え, 時系列データの周波数情報に基づく損失関数を提案する. 生成データと元データを周波数空間へ写像し, コヒーレンスを計算することで空間情報だけでなく周波数特性の一部を考慮した損失関数とする. 提案手法を人の振る舞い生成タスクに適用し, 周波数情報に基づく損失関数による効果を検証した. 結果より, 周波数情報を考慮することで, 空間情報のみの場合と比較し, Frechet Inception Distanceが改善することを確認した.

  • 柴崎 誉広, 中村 泰, 岡留 有哉
    セッションID: 4K1-GS-9-05
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    対話においては、相槌や顔の表情、ジェスチャなどの振る舞いがあり、これらは対話相手の影響を受けて、どの振る舞いを表出するかを決定する。このとき、各人のジェスチャの大きさや速さはその人の持つ個性等に影響を受けると考えられる。本研究では、対話中の振る舞い生成のため、他者評価による話者の個性に基づく拡散確率モデルpersonality-aware interaction diffusion model(PIDM) を提案する。PIDMは、他者評価の個性と話者らの特徴量を同時に扱う、対話中の振る舞い生成が可能なモデルである。話者から得られた特徴量に対し、2値行列で表されたマスクを適用することで、一部の特徴量を削除する。これにより、人の振る舞いのような多次元時系列データの条件付きの生成が可能になる。PIDMを対話における振る舞い生成タスクに適用した。個性に従い、生成される振る舞いの傾向に差異が生じるかを検証する。実験結果より、Big5の1パラメータである外向性を変更することで、振る舞いの生成傾向を制御できることが示唆された。

  • 竹味 和輝, 佐久間 拓人, 加藤 昇平
    セッションID: 4K3-GS-10-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    本稿では,東京ディズニーリゾート内のアトラクションの待ち時間を予測し,待ち時間と移動距離を最小限に抑えるルートを提供するアプリケーションを提案する. これらのテーマパークにおける待ち時間や移動時間は,一般に長いとされている.しかし,訪問者の行動を工夫することで,これらの時間を最小限に抑えることが可能である.近年,公式のアプリケーションを通じて現在の待ち時間を確認できるようになり,ソーシャルメディア等で効率的な回り方に関する情報が共有されている.しかし,個々の訪問者の好みや日時を考慮した効率的なルートを構築するアプリケーションの開発は進んでいない. これらの問題点を解決するTDL/TDS AIナビを提案する. TDL/TDS AIナビでは,利用者が乗りたいアトラクションを選択するだけで,効率的なルートを自動的に提案する.待ち時間の予測には勾配ブースティングを使用し,予測された待ち時間をもとに進化戦略を用いてルートを最適化する.実地検証として,東京ディズニーシー内で8アトラクションの巡回においてTDL/TDS AIナビの使用により2時間41分の時間短縮が達成された.

  • 作業員の負担も考慮した、持続可能な物流センター実現に向けた提案
    引網 康暁, 石川 真之介
    セッションID: 4K3-GS-10-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    昨今、物流の「2024年問題」が盛んに叫ばれているように、物流業界における人手不足が深刻化しており、まさに物流危機が迫っている。ECの取り扱い量の増加に伴い、商品の保管や出荷を担う物流センターの生産性向上が強く求められている中、ピッキング業務の効率化のため、棚搬送型倉庫ロボットが導入されている。棚搬送型倉庫ロボットは作業員との協調システムであり、作業員には梯子の昇降、身体の屈伸、段取り替えといった作業が発生している。人手不足の物流業界において、持続可能な物流センターを運営していくためには、作業員の負担も考慮に入れた生産性向上が必須となる。本研究では、棚搬送型倉庫ロボットによる移動棚の移動時間の最小化と、作業員による作業時間の最小化で構成される多目的非線形最適化問題をイジング模型によって求解し、最適な商品配置計画の存在を明らかにした。また、商品配置計画に対して、商品の出荷シミュレーションを実施し、実際の物流センターでの運用上の有効性を検証した。

  • 沢藤 光, 尾﨑 亮太, 本村 拓斗, 松田 豊久, 遠嶋 雅徳, 内田 絢斗, 白川 真一
    セッションID: 4K3-GS-10-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    鉱山ブルドーザの自己位置推定には全地球航法衛星システム(GNSS)が利用されてきた.しかしオープンピットの谷底での作業時などGNSSの情報を利用できない場面では,GNSSに依存した自己位置推定はうまく働かない.そこで本論文ではGNSSに依存しない鉱山ブルドーザの自己位置推定手法を提案する.提案手法はローカル座標系での3軸速度を推定する速度推定部とグローバル座標系での位置や姿勢を推定する位置推定部から構成される.速度推定部では内界センサの情報を機械学習モデルに入力しローカル座標系での3軸速度を推定する.位置推定部では速度推定部で推定したローカル座標系の速度とIMUで計測した角速度および加速度からグローバル座標系での位置や姿勢を拡張カルマンフィルタを用いて推定する.評価実験では機械学習モデルを使用しない従来手法と比較して提案手法の位置推定精度が高いことを確認した.特に掘削などのスリップが多発する作業中において,提案手法は精度の高い位置推定が実現できていることが確認できた.

  • 浜中 雅俊
    セッションID: 4K3-GS-10-04
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    非GPS環境にいて3次元地形図を深層学習することでドローンの位置・方向推定の解像度を向上させる手法を提案する.屋外を飛行するドローンの位置推定には,通常GPSが使用される.しかし,GPS衛星からの信号が高い山や建物に遮られたり,妨害信号があったりすると,位置の推定が困難になる.このGPSのロストを防ぐために,我々はこれまで,3D地形図を深層学習することで飛行エリアを推定する手法を構築してきた.その方法では,40メートル四方の25のエリアで実験を行ったところ,98.4%の精度で飛行エリアを正しく推定することが可能であった.しかし,40メートル四方の分解能は低すぎてドローンを制御することは困難である.そこで本研究では,エリア検出および方向検出を多重化することで,分解能を向上させることが可能かどうかを検証する.実験の結果,25メートル四方の分解能でのエリア推定で96.8%の精度,12方向の推定で方向推定で92.6%の精度となった.

  • 牛久 雅崇, 熊谷 雄介, 横井 祥
    セッションID: 4K3-GS-10-05
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    データフュージョンは独立に収集された複数のデータセットを統合し,単一のデータセットとして扱えるよう変換する方法である.本論文では,ドメイン間で共通のユーザや特徴量の存在を前提とせず,代わりにユーザの年齢や性別といったごく少数の属性がドメイン間で共通して観測される状況を扱う.この「共通情報」を手掛かりとして活用しつつ,最適輸送理論に基づきユーザ間類似度を推定する手法を提案する.複数の実データを用いた数値実験により,提案手法の有効性を示す.

  • 伊藤 有生, 加藤 昇平, 佐久間 拓人, 大嶽 れい子, 桝田 道人, 伊藤 信二, 渡辺 宏久
    セッションID: 4L1-GS-10-01
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年,急速な高齢化に伴い,パーキンソン病(PD)患者が増大している.PDは運動機能低下を主症状とする神経変性疾患であり,進行により日常生活動作が困難となるため早期発見が望まれる.しかしながら,PDの臨床症状は他の神経変性疾患と重複しているため,診断プロセスにおける患者負担が大きく,早期診断が難しい点が現状の課題である.そこで本研究ではPDの簡易検出を目指し,PD特有の発話障害に着目した音声解析に基づくPD判別モデルを提案する.PD患者134名,健常者(HC)94名を対象に自発話課題の回答音声を収録した.音声データから,韻律特徴を捉えるための特徴量セットComParE 2016である音響特徴6373種に言語特徴17種,時間特徴4種を加えて特徴抽出した.得られた特徴量から赤池情報規準を指標としたステップワイズ法によって特徴選択した後,RBFカーネルを用いたSVMを弱学習器とするアンサンブル学習モデルを構築した.判別性能を確認した結果,F値0.94,感度0.95であった.音声モダリティ特徴を用いた本手法は、PDの簡易スクリーニングに有用である可能性が示された.

  • 大園 健史, 藤澤 璃子, 大崎 美穂, 白浜 公章, 松川 真美, 小林 恭代, 斎藤 こずえ, 山上 宏
    セッションID: 4L1-GS-10-02
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    脳動脈閉塞は死や重篤な後遺症を引き起こす恐れがあり,発症後の速やかな診断治療が予後を決定付ける.この問題解決に向け,我々は救急医療現場で使用可能な閉塞診断支援システムを開発してきた.本システムは脈波測定装置と閉塞推定手法から成り,脈波に含まれる閉塞からの反射を手がかりとして閉塞の有無を推定する.閉塞推定では特徴量の定義の困難さと閉塞あり事例の不足が問題となる.本研究では,特徴量の自動抽出と閉塞なし事例のみによる分類が可能な閉塞推定手法を提案する.本手法ではオートエンコーダ (AE)により脈波を自己再生し,自己再生性能の閾値処理により閉塞有無を判別する.AEには様々な選択肢が考えられるため,代表的なモデルであるMLP型,RNN型(RNN,LSTM,GRU),CNN型を比較する実験を行い,適するものを選定する.その結果,全AEについて提案手法の正解率,適合率と再現率を統合したF値はともに,ランダム分類や全陽性分類の値を超えた.中でもGRU とCNN が比較的高性能であった.ゆえに,AEによる教師なし分類に基づく閉塞推定手法が有効であることと,GRU AEとCNN AEが適することが示された.

  • 塚田 信吾, 塩澤 暁広, 岩崎 雄樹, 塚田 弥生, 大場 拓慈
    セッションID: 4L1-GS-10-03
    発行日: 2024年
    公開日: 2024/06/11
    会議録・要旨集 フリー

    近年、心電図(ECG)データに対する解析が多く行われているが、その多くはニューラルネットワークを利用している。しかしながら、ニューラルネットワークでは分類・異常検知を行うことは得意としているが、医学的な原因を探ることが難しい。本研究では、ECGを累積ガウス関数の重ね合わせによって表現する方法「テンソル心電図」を採用する。これにより、ECGの時間的変化をFiitingパラメータとして表現可能になり、結果として心電図のわずかな変化、特に再分極相の変化を数値化・可視化することが可能になる。今回、この手法を実際にECGへ適用し、異常発生の前兆等が捉えられるかの初期的検証を行った。その結果、異常発生の前にFiitingパラメータの振動的な変化等が観察され、異常の予測可能性が示唆された。

feedback
Top