今月号は,「知覚情報処理とその応用」と題してお届けします。
“知覚情報技術とは,知覚(視覚,聴覚,触覚,嗅覚,味覚)に相当するセンサ,例えば,カメラやマイクロフォン,タッチセンサ等で感知された信号強度や波形を符号化して情報化する”ものです1)。知覚情報の処理技術を生かして人間の知覚を補完,高度化させることによって,人間の体験を向上させたり,障害がある方の生活を改善させたりといった効果が期待できると考えられます。よく知られている例として,キリンホールディングスが明治大学総合数理学部の宮下芳明研究室と共同開発した“減塩食品の塩味を約1.5倍に増強させる”エレキソルトデバイスなどが挙げられます2)。
当該分野はAI技術・機械学習技術との関係も深く,注視すべきものである一方,会誌の主たる読者であるインフォプロの皆様の方からすると馴染みの薄い分野であるように考えられます。
そこで本特集では,様々な観点での知覚情報処理技術に携わっている研究者の方々に研究内容をご紹介いただきながら,応用方策についてもご解説いただきました。
愛知淑徳大学心理学部の太田直斗様,名古屋大学大学院情報学研究科の北神慎司様には,総論として,人間の知覚と情報処理について,主に視覚的なオブジェクト認知におけるカテゴリーの問題と,その応用研究である視覚シンボル認知の観点から概説していただきました。
横浜国立大学大学院環境情報研究院の岡嶋克典様には,複数の間隔を同時に刺激することで生じるクロスモーダル効果やマルチモーダル効果について,視覚系を中心に最近の知見をご紹介いただきました。
愛知産業大学の西村雅史様には,人間の音の知覚方法や音声認識に関する研究を紹介いただいたうえで,音声以外の音,特に生体音を対象とした研究例を通して音情報の持つ新たな可能性をご紹介いただきました。
東京工科大学メディア学部の盛川浩志様には,人の動きをデータ化する主要な手法を具体的に取り上げていただいたうえで,加速度センサやVRを利用した身体計測の研究事例をご紹介いただきました。
神奈川工科大学情報学部の服部元史様には,研究開発に取り組まれている嗅覚VR装置を紹介しながら,嗅覚VRを視聴覚VRと相乗効果を上げていく試みや,「香りの有機化学」の研究成果に依存している嗅覚VRならではの困難について取り上げていただきました。
NTT株式会社コミュニケーション科学基礎研究所の横坂拓巳様には,知覚情報処理に関する教材として,ご所属の企業が運営するウェブサイト「イリュージョンフォーラム」の事例を取り上げていただきました。
読者の皆様におかれましては,第一線で研究・実践に取り組まれている執筆者の方々の論考を通じて,知覚情報処理の動向を学び,各分野におけるインフォプロとしての業務に活かしていただければ幸いです。
(会誌編集担当委員:青野正太(主査),田野倉知士,野村周平,水野澄子)
1) 大城 英裕.知能メカトロニクス分野と連携する知覚情報技術.電気学会論文誌C(電子・情報・システム部門誌).2016,vol.136,no.8,p.1037.
2) “電気の力で、減塩食の塩味を約1.5倍に増強するスプーン・お椀を開発”.キリンホールディングス.https://www.kirinholdings.com/jp/newsroom/release/2022/0907_01.html, (参照2025-11-07).
本稿では,人間の知覚と情報処理について,主に視覚的なオブジェクト認知におけるカテゴリーの問題と,その応用研究である視覚シンボル認知の観点から概説した。カテゴリー研究については,意味を認識する上で基盤となる基本レベルのカテゴリーの存在を説明した。また,視覚シンボルの理解においては,身体化された認知の観点から,その「わかりやすさ」が説明可能であることを指摘した。これら一連の研究から示唆されるのは,人間の情報処理システムは身体の制約に基づいて構築されており,その結果として,人間特有の知覚や情報処理に偏りが生じるという点である。
五感情報学とは五感それぞれの特性やメカニズムを解明して工学的に応用する科学技術の総称であるが,2つ以上の感覚を同時に刺激した際には,ある感覚が他の感覚を変調させるクロスモーダル効果や相乗的なマルチモーダル効果が生じる。今回は,視覚系を中心に五感情報学とクロスモーダル技術について最近の知見を紹介するとともに,これらがもたらす社会的インパクトについて言及する。食品の外観は食品のおいしさや鮮度などを推定するための重要な情報であるが,リアルタイム動画像処理技法とXR技術を使って食品や飲料の見た目だけを変調させるだけで,人工的に味覚や食感をコントロールできることを示す。
人間の知覚,特に音に関する知覚を再現・高度化する研究が活発に行われている。なかでも,音声認識は長年この分野の中心的な研究テーマである。言語や話者に起因する多様性に加え,騒音などの収録環境の影響も大きく,長らく困難な課題とされてきたが,近年では,大規模データで学習したモデルによって,特定の条件下ではあるが,すでに人間と同等もしくは上回る認識精度が得られたとも報告されている。一方で,応用は音声にとどまらず,音を利用した新たな研究領域も広がりつつある。本稿では人間の音の知覚方法や音声認識に関する研究を概観したのち,音声以外の音,特に生体音を対象とした研究例を通して音情報の持つ新たな可能性を紹介する。
本稿は,人の動きをデータ化する主要な手法について概説する。主な方式として,加速度センサ・ジャイロセンサを用いるIMU,磁気式位置センサ,HMDのInside-out/Outside-in方式のハイブリッド,フルトラッキングデバイス,光学式マーカーを用いたモーションキャプチャ,ビデオ画像ベースの姿勢推定方法を紹介し,それぞれの方式における長所・短所と留意点について解説している。また,動きをデータ化することによって可能となる研究として,バイオメカニクス,人間工学,HCI,VR分野の事例を挙げ,研究に対して適切な方式を選択する参考となる情報を提供する。
人間の五感(視覚・聴覚・力覚・嗅覚・味覚)に与える情報を,コンピュータ技術を駆使しながら機械的・電気的・化学的に作り出す理論・技術は,Virtual Reality(VR)と呼ばれている。このVR研究において,視覚VR・聴覚VR・力覚VRの研究・開発が製品実用化レベルまで進んでいるのに対して,嗅覚VRの研究開発は遅れており,基礎研究の段階にある。そこで筆者達が研究開発している嗅覚VR装置(圧電素子型の嗅覚ディスプレイ)を紹介しながら,嗅覚VRを視聴覚VRと相乗効果を上げていく試みや,「香りの有機化学」の研究成果に依存している嗅覚VRならではの困難について論じていく。
錯覚現象は脳の情報処理メカニズムを理解するための科学的な手がかりであるだけでなく,感覚提示装置の設計など工学応用にも有用である。また,科学教育においても人々の知的好奇心を喚起する題材として有効である。本稿では,錯覚現象をより多くの人々に伝え,共有していく方法として『レシピ化』という視点を取り上げる。NTTが運営するウェブサイト『イリュージョンフォーラム』では,従来の視覚や聴覚の錯覚に加えて,触覚における錯覚を体験する方法をレシピ形式で公開してきた。本稿は,その事例を通じて,体験の安定性や再現性の課題,体験者によるアレンジが,錯覚現象の科学的探究にどう影響し得るかを議論する。
近年,研究公正や研究成果の再利用といった文脈で,機関による研究データ管理(RDM)の重要性が広く認識されつつある。国内においても,オープンサイエンス政策の一環としてデータポリシー策定や基盤整備が進められている。本稿では,国内大学や研究機関を対象とした研究データ管理の取り組み状況に関するオンライン調査に基づき,国内大学・研究機関におけるRDMサービスの現状を報告する。2024年調査では,国立大学を中心にデータポリシー策定率が70.9%と大幅に増加し,RDM体制構築の取り組みも活発化している。資金面では外部資金に依存する機関が多いものの,ITインフラやRDM支援サービスへの投資を中心に予算化が進んでいる。RDM支援サービス面では,機関リポジトリ等の提供,研究データのストレージ提供,データ管理計画作成支援が伸びを見せている。一方で,データリテラシー支援やデータキュレーション支援などの需要が高まっており,コンソーシアムの枠組みなどを活用した専門人材の育成・確保が今後の課題である。