画像電子学会研究会講演予稿
Online ISSN : 2758-9218
Print ISSN : 0285-3957
最新号
選択された号の論文の21件中1~21を表示しています
  • 本郷 元優, 北 直樹, 斎藤 隆文
    セッションID: 24-03-01
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    既存のアルゴリズムでは,伝統的な組み合わせパズルの自動生成が可能であるが,デザイナーが指定できるのはパズルの形状およびピースの数に限られ,解法に関する制御は提供されていない.本研究では,ピースの動作方向をデザイナーが指定可能とする新たな手法を提案し,デザイン意図に即したパズルの生成を実現する.従来の研究においては,枠を有する2次元パズルにおいて同様の制御が達成されていたが,本研究では3次元の組み合わせパズルにおける分解手順の探索を主題とする.本手法では,既存のピースを挟むように新たなピースを生成する過程を繰り返すことで,ピースの動作方向を意図的に制御する.
  • 道本 実理, 斎藤 隆文
    セッションID: 24-03-02
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    モアレアニメーションとは干渉縞の連続的な移動によって実現するアニメーション表現手法である.モアレアニメーション分野の課題として,限定的な動きのみしか実現されていないという,表現の幅の狭さが挙げられる.本研究では,動画を入力としてモアレアニメーションを作成する手法を提案する.提案手法により,モアレアニメーションと似たアニメーション表現手法であるスリットアニメーションとの統合手法を確立することで,両アニメーションの利点を兼ね備えたアニメーション表現を実現する.その結果,既存手法で作成困難であった動きについてもモアレアニメーションの表現が可能となった.
  • シュ カトウ, 阿倍 博信
    セッションID: 24-03-03
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    2Dキャラクターアニメーションの制作時では,元画像である 2Dイラストに対して目や髪などの個別のパーツに分割する必要があるが,手作業では作業時間の増大が課題となっていた.本研究では,Vision Transformer (ViT)の一方式であるMask2Formerを用いた髪パーツを対象にしたセグメンテーション方式を提案する.データセットを用いて評価実験を行った結果,その有効性について確認することができた.
  • 周 逸峰, 阿倍 博信
    セッションID: 24-03-04
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    キャラクタを動かすゲームの開発においては,大量の顔画像が必要になる.近年,AI を用いて 顔画像を自動生成するサービスが増加しているが,生成画像における一定数の異常画像が存在することが見られる. 本研究では AI 生成画像 の 品 質 向 上 を 目 的 と し て , 表 情 差 分 付 き の 顔 画 像 を 自 動 生 成 で き るStyleGAN2 に基づくゲームキャラクタの顔画像自動生成システムにおいて,機械学習を用いて正常画 像と異常画像を識別する方式について報告する.
  • 村田 章悟, 北 直樹, 斎藤 隆文
    セッションID: 24-03-05
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    本研究では,プレイ中の心拍数を用いた動的なステージ生成を行なうランアクションゲームを開発し,UXの向上を目指すとともにプレイへの影響を調べた.ステージ生成は通路と部屋のブロックを配置することで行ない,心拍数等のパラメーターで生成するステージを調整した.実験として,手動配置(調整無し),ゲーム内データを用いた調整,心拍数での調整,その両方を用いた調整の4パターンを2回(1人1パターン),計8人実施した.その結果,手動配置より自動生成の方がスコアがバラつかず,安定した楽しさを提供できた.また,心拍数の変化は個人差が大きく,ゲーム内データなどの多要素と組み合わせた方が実用的な可能性があるという考察が得られた.
  • 侯 瑞博, 李 印豪, 陳 延偉
    セッションID: 24-03-06
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    病理画像分類は、がんや炎症の診断における重要な手法である。その分類精度は深層学習の発展 により大きく向上してきた。本稿では、線形分類から事前学習済みビジョンモデル、さらにプロンプト学習を用い た視覚言語モデル(VLM)への進展を体系的に整理する。VLM による視覚と言語の統合やプロンプト学習を活用 したドメイン知識の効率的な利用した高精度な病理画像分類について報告する。
  • Jihong Hu, Yinhao Li, Yen-wei Chen
    セッションID: 24-03-07
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    Accurate segmentation of medical images often requires substantial expert annotations, making the labeling process costly and time-consuming. In this study, we present a parameter-efficient fine-tuning strategy for the Segment Anything Model (SAM) to enable label-efficient interactive segmentation in medical imaging. Unlike conventional full-model fine-tuning, our approach utilizes lightweight adaptation techniques—spatial prior adapter (SPA)—that can be trained with only a small fraction of additional parameters. By leveraging SAM’s powerful, general-purpose segmentation capabilities and tailoring it to domain-specific characteristics through minimal parameter updates, we achieve high-quality interactive segmentation results with significantly reduced labeling effort. Experimental evaluations on two medical imaging datasets demonstrate that our method significantly enhances SAM’s adaptability to medical images. Even with a limited number of labels, it achieves superior performance compared to other specialized interactive segmentation models.
  • 三ツ井 真生, 髙橋 蒼空, 市川 想来, 吉田 慧一郎, 土居 裕和, 中平 勝子, 島川 陽一, 中山 友紀
    セッションID: 24-03-08
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    我々は,様々な場所で血行動態変化可視化を可能とする技術開発を目標として,近赤外線撮影を可能にした汎用一眼カメラを用い,ヒト前腕部や足側面部における血管領域の撮影・取得を行っている.提案手法では取得した画像にグレーカードを基準とした反射率画像の算出を行い,反射率変化から血行動態変化を推察できないか試みている.本手法は非接触で血行動態変化を可視化することが可能であり,熱中症などの未病技術への応用が可能であると考えられる.実験では,提案手法と血流流速計測結果等の既存の手法の比較検討を行うと共に,汎用一眼カメラの撮影設定を変更した際に取得画像に及ぼす影響を調査し,本システムに適した撮影条件を模索した.
  • 劉 濛, 平山 亮
    セッションID: 24-03-09
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    大規模言語モデル(Large Language Models; LLMs)を基盤とする感情化インテリジェントチャットボットシステムを作成した。本システムは、複数のキャラクター間でのスイッチングが可能であり、ユーザーは自身のニーズに合わせて適切なキャラクターとの対話を選択することができる。その結果、チャットボットの感情表現能力および理解力が大幅に向上した。LangChain フレームワークの利用により、LLMs の開発プロセスが簡素化され、プロンプト技術との組み合わせによって、チャットボットの感情表現力と理解力の強化が達成された。本システムの特徴は、異なるプロンプト設計を通じてキャラクターの切り替えを実現し、ユーザーの個別化ニーズに対応すること、マルチモーダル入力への対応により、より自然なインタラクションが可能なこと、写真を基に物語性コンテンツを生成する機能も導入されていることである。以上の特性により、本システムは人間とコンピュータ間の自然なインタラクションを促進し、感情的理解と反応の強化に寄与する。
  • JOHN SILAS Okello, Rahul KUMAR JAIN, Yen Wei CHEN
    セッションID: 24-03-10
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    Hepatic tumors pose significant diagnostic challenges due to their diverse biological behaviors and the inherent limitations of traditional imaging methods. These limitations often result in delayed or imprecise diagnoses, especially in resource-limited settings where advanced tools are not readily available. This study investigates the application of radiomics and Machine Learning (ML) to address these challenges, focusing on the classification of hepatic tumors and the prediction of early recurrence in Hepatocellular Carcinoma (HCC). Radiomic features were extracted from multi-phase CT images and used to train machine learning models, achieving an accuracy of 80% in tumor classification and 71% in HCC recurrence prediction. To ensure clinical relevance and usability, the models were integrated into a user-friendly web application. This integration emphasizes the feasibility of applying advanced machine learning techniques in practical, real-world medical contexts, highlighting their potential to enhance diagnostic precision, especially in resource-constrained environments.
  • 川崎 詩織, 斎藤 隆文
    セッションID: 24-03-11
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    本研究では,ダンス動画からフォーメーションを自動で抽出可能なシステムを構築することで,欲しいシーンのフォーメーションを手軽に取得できる手法を提案する.提案手法では,ダンサーの立ち位置を表す「構成図」を作成し,必要に応じてフォーメーションを線対称に整える整形を行った.また,実際のダンス動画を用いて実験を行ったところ,少人数でのダンスパフォーマンスにおいて,ほとんどのシーンで全員のフォーメーションを抽出することができた.
  • 石走 涼, 前原 秀明
    セッションID: 24-03-12
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    ソーセージの皮膜には羊の天然腸が用いられている.これを取り扱う工場では,異物除去を行っているが,その他の羊腸の直径や長さの管理が品質向上に繋がる.しかし,天然羊腸には太さのばらつきがあり,視直径が安定しないため,目視による外観検査の難易度が高いため,工場で画像処理を用いて羊腸の直径を測定する.しかし,測定する羊腸は腸内の水の流れによって見た目が変化する. そこで,流水による視直径の変化傾向を調べたところ,羊腸の実径が小さいほど視直径の収縮が大きいことがわかった.推定直径と実測直径を比較したところ,RMSE は 0.95mm であり,目標の 1mm を達成した.したがって,実用化は可能であると判断した.
  • 小林 祐貴, 山口 泰
    セッションID: 24-03-13
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    深層学習の技術を責任の伴う分野に適用するにあたり,解釈可能なモデルの開発が必要である.本研究では,解釈可能な画像分類モデルの中でも特に有望な PIP-Net に着目し,その動作の検証と改善を行うことを目的とする.観察の結果,PIP-Net には画像領域の殆どを単一の概念(prototype)に包含して扱う現象が確認された.本稿では,この現象の問題点を指摘したうえで,損失関数の改善により現象のコントロールに成功したことを報告する.
  • 加藤 駿弥, 佐藤 生馬, 石榑 康雄
    セッションID: 24-03-14
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    近年,生活習慣病の有病者・予備群が増加している.生活習慣病の予防として,運動が有効であるとされており,運動量の増加および維持は生活習慣病の予防や死亡リスクの低減に寄与すると考えられる.健康や体力の維持・向上に有効とされるランニングは,ICT を活用した支援技術が進歩しているが,実施率の向上・維持に効果的な支援技術は限られている.そこで,本研究では AR グラスを活用した仮想のランニングパートナーによるランニング動機づけ支援技術を検討し,より効果的なランニングの動機づけを行うことを目的とする.本報告では,実空間でのランニング時に,AR グラス上で 3D 仮想パートナーの表示を行う方法と効果や影響を評価する実験について述べる.
  • 内田 樹, 岩切 宗利, 藤原 匠
    セッションID: 24-03-16
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    SLAM (Simultaneous Localization and Mapping) は,未知環境において,ロボットが自律的に移動する上で欠かせない技術である.その中でも特に,3D LiDAR (3D Light Detection and Ranging) ベースの SLAM 手法は,特定の環境下で高精度な SLAM を実現できる手法として注目を集めている.今後は,SLAM の実現が困難とされている廊下や階段など高低差を含む環境下に対応できる手法の研究開発が必要である.そこで,既存の手法に関する報告資料について調査したところ,これまでの SLAM 評価手法は,SLAM 手法が持つ課題を明らかにすることが難しいことがわかった.本報告では,3D LiDAR ベースSLAM 手法の課題をより明確にできる手法として,自己位置と姿勢に関する6成分の時間変化を評価する手法を提案する.提案手法の実証実験では,SubT-MRS を用いて,Fast-LIO および NV-LIOM の 3D LiDAR ベース SLAM 手法を評価した.その結果,従来の評価手法では不明確であった各 SLAM 手法の課題を明らかにできることがわかった.
  • 杉本 満, 岩切 宗利, 藤原 匠
    セッションID: 24-03-17
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    令和 6 年能登半島地震などの災害時,被災者支援は住家被害の程度に応じて行われるが,広域災害では被害認定調査が長期化し,罹災証明の交付が遅れる課題がある.本研究では,手持ち撮影の写真データを用い,統計的手法で建物傾斜角推定精度を向上させる方法を検討.複数の 3 次元モデルを生成し,統計的アプローチで推定値を求めた結果,目標誤差範囲(±0.172°未満)を手持ち撮影でも達成可能であることを実証できた.本手法は被害認定調査の効率化や省人化に貢献する.
  • 鶴田 遼人, 佐野 睦夫, 大西 翔, 岡山 敏哉
    セッションID: 24-03-18
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
  • 大場 暖音, 岩切 宗利, 田中 清
    セッションID: 24-03-19
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    3次元点群を生成するアプローチとして, SfM-MVS(Structure from Motion-Multi View Stereo)の入力画像に動画像を用いる方法が検討されている. このアプローチでは, 入力動画像から SfM-MVS に適したフレームを選択することが重要であり, オプティカルフローを利用する方法, pHash を用いる方法が提案され, それぞれ有効性が示されている. しかしながら, これらの方法はフレーム単体の品質を考慮していない. このため, 入力動画像にボケやブレのあるフレームが含まれると, SfM-MVS による点群再構成に悪影響を与える場合があった. そこで本研究では, ボケ/ブレを取り除くことを目的としたフレーム選択法を提案し, 実験によりその有効性を検証する.
  • 金田 和文
    セッションID: 24-03-20
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    筆者の歩んできた40余年間の大きな二つの研究の流れを俯瞰する.研究を始めたのは電磁界シミュレーションとコンピュータグラフィックスの二つの研究分野に取り組んでいた電気機器工学研究室であった.その研究室は現在ビジュアル情報学研究室となり,グラフィックス,コンピュータビジョン,機械学習,医用画像処理の研究を行っている.そして,これまで筆者は主にビジュアライゼーションとスペクトルレンダリングの二つの研究課題に取り組んできた.
  • 児玉 明
    セッションID: 24-03-21
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    近年,ネット視聴が加速しており,視聴形態が大きく変わりつつある.特に,映像配信システムにおいて,ネットワークの安定性及びトラヒック量の抑制は重要な課題である.しかしこれまでの研究では,特定の視聴サービスに対応したシステムの高効率化の研究に留まっており,視聴全体の遷移の影響を十分に考慮したトラヒック対策まで踏み込めていない.そこで,我々は利用者の視聴行為全体を捉え,年代及び性別ごとの視聴傾向に基づいた視聴モデル生成法について検討してきた.しかし,利用者の異なる視聴形態 (TV, 録画, ネット) を単純加算していたため,利用者の一日当りの視聴制限条件と現状の異なる視聴形態の組み合わせ等の課題があった.本研究では,新たに本視聴条件に基づいた視聴モデル生成法を提案した.本視聴モデルに基づき,将来のネット視聴時間延長状況として,現状の TV 視聴と録画視聴からネット視聴に遷移した場合を考え,将来のネット視聴におけるトラヒック予測を行い,トラヒック増加時間帯について考察した.
  • 山本 亮, 児玉 明
    セッションID: 24-03-22
    発行日: 2025年
    公開日: 2026/01/20
    会議録・要旨集 認証あり
    近年, 映像配信サービスが急速に拡大しており, 特に映像配信システムのデータ量の爆発と消費電力の増大が課題となっている.本研究では,キャッシュサーバ (CS) 型映像配信システムに着目し,消費電力の抑制を目的とし,新たに CS 制御器を用いた CS 制御法を提案する.本システムは,配信サーバ,CS: 可変稼働 CS,常時稼働 CSと利用者端末に加えて,CS 制御器から構成される.視聴数の少ないエリアのアクセスを常時稼働 CS に割当て,可変稼働 CS を休止し消費電力削減を図る.利用者の視聴モデルを定義し,評価実験により,従来システムより約 66% 削減できること示し,本提案法の有効性を考察した.
feedback
Top